لغتنامه احساس لِکسی پرس (LexiPers)، شامل زیر مجموعهای از واژگان نسخه دوم فارسنت است که با روشی خودکار و با سه برچسب مثبت، منفی و خنثی برچسبگذاری شدهاند. فاز اول این پروژه در حال حاضر به اتمام رسیده و طی فازهای بعدی، کیفیت برچسبهای فعلی بهبود داده خواهد شد. هرچند، طی فاز اول، به عنوان بخشی از فرایند ابتدایی پروژه، کلیه مجموعههای ترادف دارای نقش صفت، تعداد ۴۲۶۱ مجموعه، به صورت دستی و با هوش انسانی تحت عنوان مجموعه دانه (seed set) برچسبگذاری شدهاند. این مجموعه دانه میتواند به عنوان یک استاندارد طلایی (gold standard) و حتی یک مجموعه دانه اولیه برای توسعه و یا آزمودن سیستمهای برچسبگذاری لغات و دستهبندی اسناد مورد استفاده قرار گیرد. ذکر این نکته نیز ضروری است که هر ورودی در این مجموعه، شناسه متناظر (synset id) در مجموعه فارسنت را نیز به همراه خود دارد، بنابراین به راحتی میتوان مجموعه متناظر هر ورودی در این مجموعه دانه در فارس نت را یافت.
آزمایشگاه پردازش زبان طبیعی دانشگاه صنعتی شریف و گروه پردازش زبان طبیعی دانشگاه گیلان
– استفاده از این پیکره با ذکر منبع و برای هرگونه فعالیتی اعم از پژوهشی یا تجاری بلامانع است.
Behnam Sabeti, Pedram Hosseini, Gholamreza Ghassem-Sani, and Seyed Abolghasem Mirroshandel. 2016. Lexipers: An ontology based sentiment lexicon for Persian. In 2nd Global Conference on Artificial Intelligence (GCAI), volume 41, pages 329–339. EasyChair.
– جهت دسترسی به این مجموعه میتوانید درخواست خود را با ذکر مقطع تحصیلی/موقعیت فعلی، دانشگاه/موسسه/شرکت/سازمان مربوطه، و هدف استفاده از مجموعه به آدرس ایمیل pdr.hosseini@gmail.com (پدرام حسینی) ارسال نمایید.
بخش «اطلاعات تکمیلی» را مطالعه فرمایید.
الاسهم السعودية