پانداس (Pandas) چیست؟

شقایق ستیه نیا
1403/01/08
234
پانداس (Pandas) چیست؟

کتابخانه پانداس (Pandas) چیست؟

پانداس چیست؟ اگر تاکنون با Pandas آشنایی نداشتید، نگران نباشید در ادامه این مقاله، با یک آموزش جامع و ساده، شما را به دنیای جذاب تحلیل داده و مدیریت اطلاعات هدایت می‌کنیم. در این مقاله، از مفاهیم ابتدایی تا مفاهیم پیشرفته‌تر، همه چیز را در مورد پانداس در پایتون خواهید آموخت.

سوالی که هنگام  طی کردن آموزش پایتون برای ما ممکن است پیش بیاید این است که چگونه می‌توانیم داده‌ها را به درستی تجزیه و تحلیل کرده و از آن‌ها برای ارائه تصمیم‌های بهتر و کارایی بیشتر استفاده کنیم؟ در اینجا وارد عرصه کتابخانه‌ای می‌شویم که به عنوان یک جواب کامل برای این سوال عمل می‌کند: پانداس.

در ادامه کتابخانه پانداس در پایتون را معرفی میکنیم و سپس، با نصب و راه‌اندازی پانداس در محیط پایتون آشنا می‌شویم و به معرفی داده‌های ساختار یافته، دیتافریم‌ها، نحوه استفاده از پانداس، متدهای پر کاربرد آن و… خواهیم پرداخت در نهایت نیز یک مثال حرفه‌ای استفاده از Pandas در پایتون را باهم برسی خواهیم کرد.

این مقاله به شما امکان می‌دهد تا از آغاز تا پایان، دنیای Pandas را کشف کنید. با ما همراه باشید تا به یک سفر جذاب و پر معنا در دنیای تحلیل داده پرداخته و مهارت‌های جدیدی را کسب کنید.

Pandas چیست؟

شاید برای شما سوال شده باشد که پانداس چیست؟ Pandas یک کتابخانه متن‌باز و قدرتمند در زبان برنامه‌نویسی پایتون است که برای تحلیل و مدیریت داده‌های ساختار یافته استفاده می‌شود. این کتابخانه به شما امکان می‌دهد که با داده‌های ساختار یافته مانند جداول یا دیتافریم‌ها به راحتی کار کنید و انواع عملیات مختلفی را بر روی آن‌ها انجام دهید.

با استفاده از پانداس، می‌توانید داده‌های خود را بخوانید و به فرمت مناسبی برای تحلیل و پردازش تبدیل کنید. این کتابخانه ابزارهای مختلفی را برای تمیز کردن و پیش‌پردازش داده‌ها ارائه می‌دهد و امکانات گسترده‌ای برای انجام عملیات ریاضی و آماری بر روی داده‌ها فراهم می‌کند.

علاوه بر این، پانداس ابزارهای متنوعی برای ترسیم نمودارها و تجسم داده‌ها نیز دارد که به شما کمک می‌کند تا الگوها و روندهای مختلف در داده‌های خود را به صورت بصری بفهمید. در کل، پانداس یک ابزار قدرتمند برای کار با داده‌ها در پایتون است که امکانات گسترده‌ای را برای تحلیل، مدیریت، و بصری‌سازی داده‌ها فراهم می‌کند و به شما کمک می‌کند تا بهترین استفاده را از اطلاعات خود داشته و تصمیم‌گیری‌های بهتری انجام دهید. در ادامه مقاله pandas چیست؟ بیشتر به این موضوع می‌پردازیم.

آموزش نصب pandas در پایتون

نصب پانداس (Pandas) در پایتون بسیار ساده است و می‌توانید این کتابخانه را به راحتی با استفاده از مدیر بسته پایتون (pip) نصب کنید. در ادامه، مراحل نصب پانداس در پایتون را باهم برسی میکنیم:

1 | مطمئن شوید که pip بروزرسانی شده باشد: برای اطمینان از به‌روز بودن pip، ابتدا یک ترمینال یا پنجره دستورات را باز کنید و دستور زیر را اجرا کنید:

pip install --upgrade pip

2 | نصب پانداس: حالا که pip به‌روز است، می‌توانید پانداس را نصب کنید. برای این کار، از دستور زیر در ترمینال یا پنجره دستورات استفاده کنید:

pip install pandas

این دستور پانداس را از مخزن پیش فرض pip دریافت کرده و نصب می‌کند.

3 | بررسی نصب: پس از اتمام عملیات نصب، برای اطمینان از صحیح نصب شدن پانداس باید پیغام زیر را مشاهده کنید:

Successfully installed pandas-1.2.4

در صورتی که همه چیز به درستی نصب شده باشد، نسخه پانداس نمایش داده می‌شود.

با انجام این مراحل، شما پانداس را با موفقیت در پایتون نصب کرده‌اید و آماده استفاده از این کتابخانه برای تحلیل و مدیریت داده‌ها خواهید بود.

برسی نسخه‌های مختلف پانداس

هر نسخه جدید پانداس ممکن است با بهبود‌های عملکردی و اضافه‌های جدیدی ارائه شود. این بهبودها معمولاً شامل بهینه‌سازی‌های الگوریتمی، افزایش کارایی، و اضافه شدن قابلیت‌های جدید می‌شوند. همچنین، تغییراتی در رفتار و رابط کاربری ممکن است صورت گیرد و باگ‌ها و مشکلات موجود در نسخه‌های قبلی اصلاح شوند. این اصلاحات و بهبودها باعث بهبود کارکرد و قابلیت اطمینان پانداس می‌شوند.

همچنین، سازگاری با نسخه‌های جدید پایتون و دیگر کتابخانه‌ها نیز توسط نسخه‌های جدید پانداس مد نظر قرار می‌گیرد تا کاربران بتوانند به‌راحتی از این کتابخانه استفاده کنند. به طور خلاصه، هر نسخه جدید پانداس با بهبودها و اضافه‌های مختلفی که ارائه می‌دهد، تفاوت‌های مهمی با نسخه‌های قبلی این کتابخانه دارد که می‌تواند تجربه کاربران را بهبود بخشد در نتیجه همیشه بهتر است که از آخرین نسخه آن استفاده کنید.

مقایسه کتابخانه Pandas و NumPy

کتابخانه‌های Pandas و NumPy هر دو ابزارهای بسیار مفید و قدرتمند در زمینه کار با داده‌ها و عملیات علم داده محسوب می‌شوند، اما هرکدام ویژگی‌ها و کاربردهای خاص خود را دارند. در ادامه، به مقایسه Pandas و NumPy از نظر ویژگی‌ها، کاربردها و قابلیت‌های مختلف می‌پردازیم:

ساختار داده‌ها

  • NumPy اصولاً برای کار با آرایه‌های چند بعدی و ماتریس‌ها مناسب است.
  • Pandas به شما امکان می‌دهد با داده‌های ساختار یافته مانند دیتافریم‌ها (جداول) کار کنید که اطلاعات را در قالب ستون‌ها و ردیف‌ها ذخیره می‌کند.

کاربردها

  • NumPy برای عملیات ریاضی سریع و کار با داده‌های عددی مناسب است، مانند محاسبات آماری، جبر خطی، تبدیل فوریه، و …
  • Pandas برای تحلیل داده‌ها، پردازش داده‌های ساختار یافته، و انجام عملیات مانند فیلترینگ، ترکیب داده‌ها، و ترسیم نمودارها مورد استفاده قرار می‌گیرد.

پردازش داده‌ها

  • Pandas دارای ابزارهایی برای تمیز کردن داده‌ها، جستجو، مرتب‌سازی، و تبدیل داده‌ها به شکل‌های مختلف است.
  • NumPy برای انجام عملیات ریاضی سریع و کار با آرایه‌ها بدون نیاز به حلقه‌های تکرار مناسب است.

سرعت و بهینه‌سازی

  • NumPy به دلیل پیاده‌سازی‌های بهینه و برخوردهای به‌درون سیستم عامل در زبان C، به صورت عمده برای کاربردهای عددی سریعتر از Pandas استفاده می‌شود.
  • Pandas به دلیل پیچیدگی بیشتر و قابلیت‌های بیشتر، ممکن است در برخی موارد نسبت به NumPy کندتر عمل کند، اما برای کار با داده‌های ساختار یافته بسیار مناسب است.

به طور خلاصه، هرکدام از Pandas و NumPy ویژگی‌ها و کاربردهای خاص خود را دارند و می‌توانند به صورت مکمل برای هم استفاده شوند. انتخاب بین آنها بستگی به نیازها و وظایف خاص پروژه شما دارد.

ساختارهای مختلف داده در پانداس

در کتابخانه Pandas، سه ساختار داده اصلی و پرکاربرد وجود دارد که به شما امکان می‌دهند داده‌های خود را به صورت ساختارمند و منظم مدیریت کنید. این ساختارها عبارتند از:

Series

  • Series به عنوان ساختار اولیه و ساده‌ترین ساختار داده در Pandas شناخته می‌شود.
  • این ساختار داده دارای یک برچسب یا نام برای هر عنصر است که به آن Index می‌گویند.
  • هر عنصر در یک Series می‌تواند از هر نوع داده‌ای باشد، از جمله اعداد، رشته‌ها، بولین‌ها و …
  • برای ساخت یک Series می‌توانید از توابع مختلفی مانند `pd.Series()` استفاده کنید.

DataFrame

  • DataFrame به عنوان ساختار داده دوبعدی و بسیار قدرتمند در Pandas معرفی می‌شود.
  • این ساختار داده شامل ردیف‌ها و ستون‌ها است و هر ستون می‌تواند یک Series باشد.
  • DataFrame می‌تواند از فایل‌های مختلفی مانند CSV، Excel، JSON و … خوانده شود و همچنین از دیتافریم‌های ساخته شده با استفاده از سازنده DataFrame استفاده کنید.

Index

  • Index یک ساختار داده مجزا در Pandas است که برای مرتب سازی داده‌ها و اعمال عملیات مختلف به داده‌ها استفاده می‌شود.
  • این ساختار معمولاً به عنوان شناسه یا برچسب ردیف‌ها در یک DataFrame استفاده می‌شود، اما می‌تواند به صورت مستقل نیز استفاده شود.

این ساختارهای داده به شما امکان می‌دهند تا داده‌های خود را به صورت منظم مدیریت کنید و عملیات مختلفی را بر روی آن‌ها انجام دهید. همچنین، کتابخانه pandas در پایتون امکانات متنوعی برای تعامل با این ساختارهای داده ارائه می‌دهد که به شما امکان می‌دهد داده‌های خود را با دقت و کارآیی بالا مدیریت کنید.

منظور از داده‌های ساختار یافته پانداس چیست؟

داده‌های ساختار یافته به داده‌هایی میگویند که به صورت منظم و ساختارمند در قالب مشخصی ذخیره شده‌اند. این داده‌ها معمولاً به صورت جداول، ماتریس‌ها، دیتافریم‌ها، یا هر نوع دیگری از ساختارهای داده‌ای است که دارای ستون‌ها و ردیف‌ها هستند و هر ستون معمولاً یک نوع داده‌ای خاص دارد.

ویژگی اصلی داده‌های ساختار یافته، قابلیت سازماندهی و دسته‌بندی دقیق داده‌ها است. با ساختارمند کردن داده‌ها، می‌توان به سادگی به داده‌ها دسترسی داشته و عملیات مختلفی روی آن‌ها انجام داد. همچنین، داده‌های ساختار یافته امکان تحلیل و استفاده بهینه از اطلاعات را فراهم می‌کنند.

به عنوان مثال، یک دیتافریم در کتابخانه Pandas یک نمونه از داده‌های ساختار یافته است. این دیتافریم می‌تواند اطلاعات را به صورت جدولی سازماندهی کرده و به کاربر امکان می‌دهد تا عملیات مختلفی را بر روی داده‌ها اعمال کند، مانند فیلتر کردن، مرتب‌سازی، ترکیب، و تحلیل آماری. این ساختار داده‌ای بسیار مفید است زیرا به شما امکان می‌دهد تا به سادگی و به شکل منظم با داده‌های خود کار کنید و از اطلاعات بهتری برای تصمیم‌گیری‌ها و تحلیل‌های خود استفاده کنید. در ادامه مقاله پانداس چیست؟ این موضوع را بازتر میکنیم.

DataFrame چیست؟

دیتافریم یا DataFrame یکی از ساختارهای داده‌ای اصلی در کتابخانه Pandas در پایتون است. این ساختار به شما امکان می‌دهد تا داده‌ها را در قالب یک جدول دوبعدی سازماندهی کنید، که شامل ستون‌ها و ردیف‌ها است. هر ستون در یک DataFrame می‌تواند نوع داده‌ای مختلفی داشته باشد، مانند عدد صحیح، عدد ممیز شناور، رشته متنی و غیره.

DataFrame به شما امکان می‌دهد داده‌ها را به سادگی بارگیری، ذخیره، ترکیب، تحلیل و تغییر دهید. همچنین، این ساختار داده‌ای دارای روش‌ها و توابع متنوعی است که به شما امکان می‌دهد عملیات مختلفی را روی داده‌ها انجام دهید، از جمله فیلترینگ، مرتب‌سازی، ترکیب، گروه‌بندی، و محاسبات آماری.

با استفاده از DataFrame، می‌توانید داده‌های خود را به صورت منظم و منظمتر مدیریت کنید، الگوها و روندهای مهم در داده‌های خود را تشخیص دهید و تحلیل‌های معنادارتری انجام دهید. به عنوان یکی از ابزارهای اساسی در علم داده و تحلیل داده، استفاده از DataFrame در Pandas بسیار مفید و کارآمد است.

نحوه استفاده از Pandas برای وارد کردن داده‌ها

استفاده از کتابخانه Pandas در پایتون برای وارد کردن داده‌ها و ساخت دیتافریم‌ها به سادگی انجام می‌شود. این کتابخانه امکانات مختلفی برای خواندن داده‌ها از فرمت‌های مختلف مانند CSV، Excel، JSON و … فراهم کرده است. در ادامه، نمونه‌ای از نحوه وارد کردن داده‌ها با استفاده از Pandas را برسی میکنیم:

خواندن داده‌های CSV:

برای خواندن داده‌های ذخیره شده در فایل CSV، می‌توانید از تابع read_csv() استفاده کنید. به طور مثال:

import pandas as pd

#وارد کردن داده‌ها از یک فایل CSV

df = pd.read_csv('data.csv')

خواندن داده‌های Excel:

برای خواندن داده‌های ذخیره شده در فایل Excel، می‌توانید از تابع read_excel() استفاده کنید. به طور مثال:

import pandas as pd

# وارد کردن داده‌ها از یک فایل Excel

df = pd.read_excel('data.xlsx')

خواندن داده‌های JSON:

برای خواندن داده‌های ذخیره شده در فایل JSON، می‌توانید از تابع read_json() استفاده کنید. به طور مثال:

import pandas as pd

# وارد کردن داده‌ها از یک فایل JSON

df = pd.read_json('data.json')

علاوه بر این فرمت‌ها، Pandas از توابع خواندن داده‌ها برای فرمت‌های دیگری مانند HTML، SQL، و … نیز پشتیبانی می‌کند. با اجرای هر یک از این توابع، داده‌های مربوطه از فایل خوانده شده و به یک دیتافریم Pandas تبدیل می‌شود که شما می‌توانید با آن داده‌ها را بررسی و عملیات مختلفی روی آن‌ها اعمال کنید.

متدهای پرکاربرد کتابخانه Pandas

کتابخانه Pandas در پایتون دارای مجموعه‌ای از متدهای پرکاربرد و قابل استفاده برای کار با داده‌ها است. در ادامه، به برخی از این متدهای پرکاربرد اشاره می‌کنیم:

خواندن داده‌ها

read_csv()

خواندن داده‌های ذخیره شده در فایل CSV.

read_excel()

خواندن داده‌های ذخیره شده در فایل Excel.

read_json()

خواندن داده‌های ذخیره شده در فایل JSON.

read_sql()

خواندن داده‌هایی که از پایگاه داده SQL برمی‌آید.

نمایش داده‌ها

head()

نمایش تعدادی از ردیف‌های ابتدایی دیتافریم.

tail()

نمایش تعدادی از ردیف‌های انتهایی دیتافریم.

info()

ارائه اطلاعات جامع درباره دیتافریم، از جمله تعداد ردیف‌ها، نوع داده‌ها و …

تحلیل داده‌ها

describe()

ارائه آماره‌های توصیفی برای ستون‌های عددی دیتافریم.

value_counts()

شمارش مقادیر یک ستون و نمایش تعداد آن‌ها.

groupby()

گروه‌بندی داده‌ها بر اساس یک یا چند ویژگی و اعمال عملیات مختلف مانند میانگین، مجموع و …

تغییر داده‌ها

rename()

تغییر نام ستون‌ها یا ردیف‌های دیتافریم.

drop()

حذف ستون‌ها یا ردیف‌های خاص از دیتافریم.

fillna()

پر کردن مقادیر خالی (NaN) با مقدار مشخص.

ترکیب داده‌ها

concat()

ترکیب دیتافریم‌ها به صورت عمودی یا افقی.

merge()

ادغام دیتافریم‌ها بر اساس ستون‌های مشترک.

join()

انجام عملیات اتصال بر اساس شناسه.

ذخیره داده‌ها

to_csv()

ذخیره داده‌ها به فرمت CSV.

to_excel()

ذخیره داده‌ها به فرمت Excel.

to_json()

ذخیره داده‌ها به فرمت JSON.

تغییر فرمت داده‌ها

astype()

تبدیل نوع داده‌های یک ستون به نوع داده‌های دیگر.

to_datetime()

تبدیل یک ستون به فرمت زمانی.

این تنها برخی از متدهای پرکاربرد در کتابخانه Pandas هستند. Pandas دارای مجموعه‌ای گسترده از توابع و متدهاست که به شما امکان می‌دهد داده‌های خود را به طریقی قابل تحلیل و قابل مدیریت کنید.

Series در Pandas

در کتابخانه Pandas، Series یکی از ساختارهای داده‌ای اصلی است که برای نگهداری داده‌ها به صورت یک بعدی استفاده می‌شود. یک Series می‌تواند به عنوان یک ستون در یک DataFrame یا به صورت مستقل وجود داشته باشد.

ویژگی‌های اصلی یک Series عبارتند از:

  • Indexing

هر عضو در یک Series یک اندیس دارد که به آن اجازه می‌دهد به طور مستقیم به هر عضو دسترسی پیدا کنید. این اندیس‌ها می‌توانند به صورت عددی، رشته‌ای یا حتی تاریخی باشند.

  • داده‌ها

هر عضو در یک Series می‌تواند از هر نوع داده‌ای باشد، از جمله اعداد، رشته‌ها، بولین‌ها و غیره.

  • توابع و عملیات

Series دارای توابع و عملیات متنوعی است که به شما امکان می‌دهد داده‌ها را مدیریت و تحلیل کنید، از جمله محاسبات آماری، ترکیب داده‌ها، تغییر نوع داده و …

  • پرس و جو

شما می‌توانید سوالات و پرس‌وجوهای مختلفی را روی یک Series انجام دهید، از جمله فیلتر کردن، مرتب‌سازی، و …

برای ساخت یک Series، می‌توانید از تابع ()pd.Series استفاده کنید و داده‌های مورد نظر را به عنوان ورودی به آن ارسال کنید. به طور مثال:

import pandas as pd

# ساخت یک Series از یک لیست اعداد

data = [1, 3, 5, 7, 9]
series = pd.Series(data)
print(series)

این کد یک Series از اعداد 1، 3، 5، 7 و 9 ایجاد می‌کند و آن را چاپ می‌کند.

Merge در پانداس

عملیات merge در کتابخانه Pandas در پایتون به شما امکان ادغام داده‌های مختلف را بر اساس یک یا چند ستون مشترک فراهم می‌کند. به طور ساده، وقتی دو دیتافریم را با یکدیگر ادغام می‌کنید، Pandas به دنبال مقادیر مشترک در ستون‌های مشخص شده می‌گردد و سطرهای مربوطه را با یکدیگر ترکیب می‌کند.

برای انجام merge، شما به دو دیتافریم نیاز دارید که حاوی اطلاعات مشابه باشند، یعنی دارای یک یا چند ستون مشترک. با استفاده از ستون‌های مشترک، Pandas داده‌های متناظر در هر دیتافریم را با یکدیگر ترکیب می‌کند و یک دیتافریم جدید ایجاد می‌شود.

به طور مثال، فرض کنید که شما دو دیتافریم دارید که اطلاعات مشترکی دارند، مانند کد پرسنل یا نام محصول. با استفاده از عملیات merge، می‌توانید این دو دیتافریم را بر اساس اطلاعات مشترک، مانند کد پرسنل، ترکیب کنید تا یک دیتافریم جدید با اطلاعات ترکیب شده ایجاد شود.

Preprocessing در پانداس

Preprocessing در Pandas به مجموعه‌ای از عملیات مرتبط با پیش‌پردازش و تمیزکاری داده‌ها اشاره دارد. این عملیات برای آماده‌سازی داده‌ها برای مراحل بعدی تحلیل، مدل‌سازی و مصرف داده مانند ماشین لرنینگ بسیار مهم است. در ادامه، برخی از مراحل پرکاربرد preprocessing در Pandas را بررسی می‌کنیم:

1 | حذف داده‌های تکراری (Duplicate Data)

در این مرحله، داده‌های تکراری یا تکراری از دیتافریم حذف می‌شوند. این کار با استفاده از تابع ()drop_duplicates انجام می‌شود.

2 | تنظیم مجدد اندیس (Reset Index)

ممکن است پس از حذف داده‌ها یا اعمال عملیات دیگر، اندیس ردیف‌ها تغییر کند. برای بازنشانی ایندیس به حالت اولیه، از تابع ()reset_index استفاده می‌شود.

3 | تبدیل داده‌های نامعتبر یا مفقود (Handling Missing Data)

در این مرحله، داده‌های مفقود یا نامعتبر معمولاً با مقادیر مشخص (مانند میانگین یا میانه) یا با حذف ردیف‌های حاوی داده‌های نامعتبر جایگزین می‌شوند.

4 | تبدیل نوع داده‌ها (Data Type Conversion)

گاهی اوقات نیاز است که نوع داده‌های ستون‌ها را تغییر داد. این کار با استفاده از توابع مختلفی مانند ()astype یا ()to_numeric انجام می‌شود.

5 | ترکیب داده‌ها (Data Concatenation)

در صورت نیاز به ترکیب داده‌های از منابع مختلف، از توابعی مانند ()concat استفاده می‌شود.

این تنها چند مورد از عملیات پرکاربرد preprocessing در Pandas هستند. این عملیات به شما امکان می‌دهند داده‌های خود را به صورت مرتب و قابل تحلیل آماده کنید تا در مراحل بعدی تحلیل و مدل‌سازی بهتری داشته باشید.

کاربرد Groupby در Pandas

کاربرد Groupby در کتابخانه Pandas برای انجام عملیات گروه‌بندی بر اساس یک یا چند ستون مشخص در یک DataFrame استفاده می‌شود. با استفاده از Groupby، می‌توانید داده‌ها را بر اساس یک معیار خاص (مانند مقادیر یک ستون) گروه‌بندی کرده و سپس عملیات مختلفی مانند محاسبات آماری، ترکیب داده‌ها و … روی هر گروه انجام دهید.

برای استفاده از Groupby، ابتدا DataFrame خود را انتخاب کرده و سپس به وسیله یک یا چند ستون، عملیات گروه‌بندی را اعمال می‌کنید. سپس می‌توانید عملیات مختلفی مانند محاسبه مجموع، میانگین، تعداد ردیف‌ها و … را روی هر گروه انجام دهید. Groupby در Pandas یکی از ابزارهای قدرتمند برای تحلیل داده‌ها است و امکانات بسیاری برای ترکیب و تحلیل داده‌ها فراهم می‌کند.

مثالهای عملی استفاده از Pandas در پایتون

یک مثال حرفه‌ای از استفاده از Pandas در پایتون می‌تواند مربوط به تحلیل و پیش‌پردازش داده‌های مالی باشد. به طور خاص، فرض کنید که می‌خواهید داده‌های تاریخچه قیمت سهام را بررسی کنید و برخی از معیارهای مالی مهم مانند میانگین، واریانس، بازده سهام و … را محاسبه کنید.

در این مثال، از Pandas برای خواندن داده‌های مالی از یک فایل CSV استفاده می‌کنیم، سپس داده‌ها را پیش‌پردازش می‌کنیم و معیارهای مالی را محاسبه می‌کنیم.

import pandas as pd
# خواندن داده‌های مالی از فایل CSV
df = pd.read_csv('stock_prices.csv')
# نمایش چند ردیف از داده‌ها
print(df.head())
# محاسبه میانگین قیمت سهام
average_price = df['Price'].mean()
print("میانگین قیمت سهام: ", average_price)
# محاسبه واریانس قیمت سهام
variance_price = df['Price'].var()
print("واریانس قیمت سهام: ", variance_price)
# محاسبه بازده سهام
df['Return'] = df['Price'].pct_change()
print(df.head())
# نمایش آخرین ردیف از داده‌ها
print(df.tail())

در این مثال، ابتدا داده‌های مالی از یک فایل CSV خوانده شده و در یک DataFrame قرار داده می‌شوند. سپس معیارهای مالی از جمله میانگین، واریانس و بازده سهام محاسبه می‌شوند و به وسیله Pandas نمایش داده می‌شوند. این مثال نشان می‌دهد که Pandas چگونه می‌تواند به عنوان یک ابزار قدرتمند برای تحلیل و پیش‌پردازش داده‌ها در حوزه مالی استفاده شود.

چگونه پایتون را شروع کنیم؟

در این مقاله ابتدا برسی کردیم که پانداس چیست؟ در ادامه کتابخانه Pandas در پایتون را معرفی کردیم که به ما امکاناتی برای تحلیل و پیش‌پردازش داده‌ها فراهم می‌کند. ما با نصب Pandas آغاز کرده و سپس به ساختارهای اصلی داده این کتابخانه، مانند Series و DataFrame، پرداختیم. در ادامه، عملیات متداول مانند خواندن، نمایش، فیلترینگ و تغییر شکل داده‌ها را با استفاده از Pandas در پایتون مورد بررسی قرار دادیم. سپس با استفاده از Groupby و محاسبه معیارهای مالی مانند میانگین و واریانس، دید بهتری از اینکه چگونه می‌توان از این کتابخانه برای تحلیل داده‌ها استفاده کرد، به دست آوردیم.

با خواندن مقالات مختلف احتمالا بتوانید تا حدی به بخش‌های مختلف پایتون مسلط شوید اما قطعا بی‌برنامه بودن و اصولی نبودن مسیر یادگیری باعث می‌شود شما نسبت به زبان برنامه نویسی پایتون دلسرد شوید یا اینکه آن را بصورت کامل یاد نگیرید؛ اما نگران این موضوع نباشید، تیم سبزلرن برای شما آموزش صفر تا صد پایتون  را بصورت کاملا رایگان قرار داده تا بتوانید به‌صورت اصولی و حرفه‌ای در زبان پایتون متخصص شوید. اما این همه ماجرا نیست!! این دوره علاوه بر رایگان بودن آن، دارای پشتیبانی انلاین نیز هست و هرکجا به هر مشکلی برخوردید، افراد متخصص در این زبان آماده پاسخگویی به اشکالات و سوالات شما هستند، چی بهتر از این؟ پس فرصت را غنیمت بشمرید و همین الان در این دوره شرکت کنید و بصورت تخصصی یادگیری خودتان را شروع کنید.

نظرات
ثبت نظر جدید

نظری برای این مقاله ثبت نشده است

آموزش پایتون