در دنیای علم داده، یادگیری ماشین و آمار اغلب با هم ترکیب میشوند، اما هر کدام اهداف مختلفی دارند و تسلط بر یکی به معنای تخصص در دیگری نیست. استفاده از رویکرد آماری برای حل مسائل یادگیری ماشین، یا برعکس، میتواند بیشتر باعث سردرگمی شود تا روشنگری. در این دوره، کیت مککورمیک توضیح میدهد که چگونه آمار و یادگیری ماشین با هم تفاوت دارند، چه زمانی باید از هر یک استفاده کنید و چگونه از تمام ابزارهای موجود استفاده کنید تا نتایج خود را به صورت واضح و متقاعدکننده به اشتراک بگذارید.
او به موضوعاتی مانند: چرا همبستگی به تنهایی شواهد کافی برای علیت نیست؛ تفاوت بین دادههای تجربی و مشاهدهای؛ و تفاوتهای بین آمار سنتی و آمار بیزی میپردازد. کیت همچنین به بحث علیت میپردازد، که موضوعی پیچیده در استفاده از آمار و یادگیری ماشین برای اثبات علت و معلول است. اگر مدلهای یادگیری ماشین میسازید، تحلیلهای آماری انجام میدهید یا به خصوص اگر هر دو را انجام میدهید، این دوره برای شما مناسب است.
اهداف یادگیری این دوره عبارتند از:
- توضیح اهمیت مقدار p در آزمون فرضیه
- تعریف علیت: توضیح تفاوت بین همبستگی و علیت و نشان دادن چگونگی اثبات علیت
- تشخیص همخطی چندگانه: توضیح نحوه تشخیص همخطی چندگانه و توصیف استراتژی برای مقابله با آن
- تعریف استقرا، استنتاج، ابطالپذیری و ضدواقع: و سپس نشان دادن اهمیت آنها در ارزیابی مدل
- توضیح کاهش استفاده از مقادیر p با افزایش تعداد پارامترهای مدل
- توضیح نحوه آزمون عملکرد مدل در دادهکاوی
- توصیف اهداف متضاد و فلسفه آمار و دادهکاوی