نظر کاوی در سالهای اخیر با گسترش اینترنت، بازارهای الکترونیکی، بسترهای اجتماعی مجازی و تعاملات کاربران با وب به عنوان یکی از چالش های مهم یادگیری ماشین و هوش مصنوعی مورد توجه قرار گرفته است. تبدیل نظر و بار معنایی جملات به ماشین با توجه به کیفی بودن موضوع و احساسی بودن، همواره در علوم رباتیک مورد نظر بوده است. پیچیدگیهای بسیار بالای این زمینه مانند نیاز به داشتن دایره واژگان زبانی و مفهوم هر یک، یادگیری قواعد نحوی در حوزه مورد نظر، استنباط مفهوم جمله و عبارت فرد مستلزم آنالیز حجم عظیمی از نظرات برای آموزش گرفتن به صورت صحیح میباشد. بنابراین نظرکاوی به عنوان بحثی چالش برانگیز برای کاوش خودکار نظرات مطرح گردیده است.
در فاز اول گردآوری پیکره تمامی خبرگزاری کشور لیست گردیده و بهصورت اجمالی بررسی گردیدند. سپس شش مورد از معروفترین و پر بازدیدترین خبرگزاریهای ایران که تعداد نظرات آنها هم زیاد بوده انتخاب شدند و کلیهی خبرهای آن خبرگزاریها یعنی مرتبطترین خبرها در مورد هدفمندی یارانهها بر اساس نتایج خود سایت انتخاب و ذخیرهشدهاند و بعد بر اساس ابزاری که طراحی و پیادهسازی گردید، دادههای کلیدی و موردنیاز هر خبر به همراه لیست نظرات کاربران در مورد آن خبر، بهصورت خودکار استخراجشده و برای اطمینان از صحت دادهها مجدداً نیز مورد بازبینی و اصلاح قرار گرفت.
از بین خبرگزاریها شش مورد از معروفترین و پر بازدیدترین آنها که به شرح زیر است، انتخاب گردید:
- خبرگزاری الف
- خبرگزاری باشگاه خبرنگاران جوان
- خبرگزاری جام جم آنلاین
- خبرگزاری جهان نیوز
- خبرگزاری خبر آنلاین
- خبرگزاری فرارو
نظرات کاربران نیز توسط کاربر انسانی مورد بررسی قرار گرفته و به صورت دستی برچسب منفی، خنثی یا مثبت خورده اند. به این معنا که اگر نظر نویسنده متن خبر مثبت و نظر نویسنده نظر هم مثبت باشد، این نظرات همسو بوده و درنتیجه، آن نظر برچسب موافق میگیرد و الیآخر.
مجموعه دادهای شامل 304 عنوان خبری و تعداد 4848 از نظرات کاربران در مورد این موضوع گردآوریشده است. پس از بررسیهای اولیه، خبرهای غیر مرتبط از این پیکره حذف شدند. برچسبها با توجه به متن خبر و بر اساس جهتگیری نظر نویسنده متن خبر و نویسنده نظر، اختصاص دادهشده است. نحوه تخصیص برچسبها در جدول(1-5) نمایش دادهشده است.
نحوه تخصیص برچسبها به نظرات پیکره
نویسنده متن | نویسنده نظر | نتیجه |
مثبت | مثبت | موافق |
مثبت | منفی | مخالف |
منفی | مثبت | مخالف |
منفی | منفی | موافق |
پس از انجام برچسبگذاری نتایج بهصورت جدول زیر قابلمشاهده است.
نتایج برچسبگذاریهای انسانی
تعداد کل نظرات | 4851 |
تعداد نظرات مثبت | 450 |
تعداد نظرات خنثی | 2231 |
تعداد نظرات منفی | 2170
|
برای تهیه پیکره با تلفن زیر تماس بگیرید:
۰۹۳۵۹۵۲۹۰۵۸
universitydatainfo{@}yahoo.com
تلگرام: