علم داده امروزی نیازمند افراد حرفهای است که با جریانهای کاری تحلیل و ابزارهای قدرتمند آشنا باشند. پایتون میتواند در تقریباً هر جنبهای از کار با دادهها نقش اساسی ایفا کند؛ از وارد کردن و پرسوجو گرفته تا استخراج و تجسم دادهها. این دوره شامل دوازده نکته و ترفند است که میتوانید برای بهبود مهارتهای خود در پایتون به کار ببرید. این تکنیکها به راحتی قابل اجرا هستند و در وظایف رایج مدیریت داده کاربرد دارند.
برخی از این نکات شامل موارد زیر است: نحوه وارد کردن دادهها با استفاده از فایلهای CSV، JSON و TXT، نحوه کاوش دادهها با استفاده از کتابخانههایی مانند Pandas، نحوه سازماندهی و اتصال دادهها با استفاده از DataFrameها، نحوه ایجاد نمودارها و نمایش گرافیکی دادهها با استفاده از ggplot در پایتون و بیشتر.
اهداف یادگیری این دوره عبارتند از:
- کار با فایلهای فلت، از جمله Parquet
- خواندن دادهها با استفاده از APIها یا کتابخانهها
- بازرسی و تجمیع دادهها با Pandas
- خروجی دادهها با Pandas
- ایجاد نمودارها با استفاده از ggplot
- استایلدهی به نمودارها با ggplot
- تکمیل تجسمهای دادهها