فیلم آموزشی متن کاوی و وب کاوی
کسب و کارهای نوپا برای کسب اطلاعات خود چه می کنند ؟ چگونه می توان از انبوه متون آنلاین اطلاعات مفید را استخراج کرد ؟ چگونه می توان اتفاقات مرتبط با کسب و کاری نوپا را رصد کرد و سرعت در تصمیم سازی را افزایش داد ؟ چالش های پیش رو در متن کاوی فارسی چیست؟ مفاهیم اولیه متن کاوی و روش های کاربردی آن کدامند؟ پرسش هایی که در این کارگاه آمورشی به پاسخ آن ها خواهید رسید .
متن کاوی چیست؟
متن کوتاهی از ویکی پدیا فارسی :
” متنکاوی، به دادهکاویای که بر روی متن انجام شود اشاره دارد. همچنین به عنوان آنالیز متن نیز شناخته میشود که منظور از آن فرایند استخراج اطلاعات با کیفیت از متن است. اطلاعات پر کیفیت، بطور معمول از فهم الگوها و گرایشها از طریق معانی و بوسیله یادگیری الگوهای آماری حاصل میشود.
متن کاوی معمولاً درگیر در فرایند ساختاردهی به ورودیهای متنی، استخراج الگوهای درون دادههای ساختار یافته، و در نهایت ارزیابی و تفسیر خروجیها است.
وظایف متن کاوی معمول شامل دستهبندی متون، خوشه بندی متون، استخراج معنی و مفهوم، تولید ردهبندی دانهای، تجزیه و تحلیل احساسات، خلاصه کردن اسناد و مدلسازی ارتباط موجودیتها است.
هدف نهایی، اساساً تبدیل متن به داده برای آنالیز از طریق کاربرد پردازش زبانهای طبیعی و متدهای تحلیلی است. ”
- رشد فزاینده کاربرد متن کاوی در استارت آپ ها
- متن های غیر ساخت یافته، گنج های پنهان وب
- استخراج اطلاعات و آنالیز متن
- ابزار های کاربردی متن کاوی برای کسب وکارهای نوپا
- بدست آوردن قطعات اطلاعاتی کوچک از داده های متنی بزرگ بدون نیاز به خواندن همه آن
تمرکز کارگاه دوم بر روی موارد زیر می باشد :
- معرفی الگوریتمها و روش های آماده سازی متون برای متن کاوی
- معرفی مدل های زبانی
- نحوه استفاده از ابزارهای متن کاوی وب فارسی معرفی شده در کارگاه اول
- کار با n gram های گوگل و مایکروسافت به زبان ساده