دادهکاوی یکی از شاخههای علم داده است که به شناسایی الگوهای مهم و قابلاستفاده در دادههای بزرگ و متنوع میپردازد. این الگوها میتوانند شامل گروهبندی مشتریان مشابه، شناسایی روندهای بلندمدت که تنها پس از حذف اثرات فصلی و تصادفی دیده میشوند، یا ایجاد روشهای جدید برای پیشبینی نتایج کلیدی باشند. در این دوره، بارتون پولسون شما را با اصول دادهکاوی به کمک زبان برنامهنویسی پایتون آشنا میکند. ابتدا با ابزارهای ضروری برای دادهکاوی شروع میکند و سپس به توضیح مباحث کاهش ابعاد داده میپردازد. در بخش خوشهبندی، مفاهیمی مانند خوشهبندی سلسلهمراتبی، الگوریتم k-Means، DBSCAN و سایر روشها را بررسی میکند.
همچنین، بارتون روشهای دستهبندی دادهها مانند kNN و درختهای تصمیمگیری را آموزش میدهد. او در ادامه به تحلیل انجمنی میپردازد و تکنیکهایی مثل Apriori، Eclat و FP-Growth را معرفی میکند. در پایان، مباحث تجزیه و تحلیل سریهای زمانی را بررسی کرده و دوره را با موضوعات مرتبط با دادهکاوی متنی مانند امتیازدهی احساسات و ابزارهای دیگر به اتمام میرساند.