با افزایش دادههای عمومی در دسترس و تمرکز بیشتر بر دادههای متنی بدون ساختار، یادگیری نحوه پاکسازی، پردازش و تحلیل این دادهها بسیار ارزشمند است. اگر با پایتون آشنایی دارید و به پردازش زبان طبیعی (NLP) علاقهمند هستید، این دوره میتواند دانش لازم برای حل مشکلات پیچیده با استفاده از یادگیری ماشین را به شما ارائه دهد. در این دوره، مدرس درک جدامسکی، مفاهیم پایهای پردازش زبان طبیعی (NLP) را به صورت خلاصه معرفی میکند و سپس به تکنیکهای پیشرفته پاکسازی داده و برداریسازی میپردازد. در نهایت، به صورت عمیق به ساخت طبقهبندهای یادگیری ماشین میپردازد. در این بخش، درک دو نوع مدل یادگیری ماشین مختلف را معرفی میکند و نحوه ارزیابی و تست تغییرات این مدلها را نشان میدهد.
اهداف یادگیری این دوره عبارتند از:
- تعریف NLP را توضیح دهید
- فرآیند توکنیزاسیون را توصیف کنید
- هدف از برداریسازی را شناسایی کنید
- نتایج لماتیزاسیون را تشخیص دهید
- ویژگیهای TF-IDF را خلاصه کنید
- دقت را در قالب معیارهای ارزیابی تعریف کنید
- سه مزیت استفاده از روشهای ترکیبی را به یاد آورید