هر روز حجم زیادی از دادههای متنی نامنظم توسط رسانههای اجتماعی، صفحات وب و منابع دیگر تولید میشود. اما بدون توانایی مدیریت و استفاده از این دادهها، نمیتوان هیچ ارزشی از آنها استخراج کرد. در این دوره، یاد میگیرید که چگونه دادههای متنی نامنظم را به بینشهای قدرتمند با استفاده از پایتون تبدیل کنید. مدرس، درک جدامسکی، با مرور سریع مفاهیم پایهای پردازش زبان طبیعی (NLP) شروع میکند، از جمله چگونگی پاکسازی دادههای متنی و ساخت مدل بر روی متن برداری شده. سپس به موضوعات پیچیدهتری مانند word2vec، doc2vec و شبکههای عصبی بازگشتی میپردازد. در پایان دوره، این مفاهیم را در یک زمینه واقعی با اعمال آنها به یک مسئله یادگیری ماشین، به شما ارائه میدهد.
اهداف یادگیری این دوره عبارتند از:
- توضیح اهمیت پردازش زبان طبیعی (NLP)
- تحلیل نحوه پاکسازی دادههای متنی
- تفسیر اهمیت ساخت مدل بر روی متن برداری شده
- توضیح اهمیت word2vec
- اعمال تکنیکها برای آمادهسازی بردارهای سند برای مدلسازی
- بررسی شبکههای عصبی بازگشتی (RNNs)
- ارزیابی روشها با استفاده از معیارهای عملکرد کلیدی