دستهبندي متن شامل نسبت دادن اسناد به يکي از چند گروه از پيش تعيين شده است. براي نايل شدن به اين هدف اسناد ورودي توسط يک مجموعه از مشخصات[1] که معمولاً خصوصيات[2] ناميده ميشود توصيف ميشوند. برخلاف خوشهبندي[3] که شامل آموزش بدون نظارت است، در دستهبندي يک مجموعه آموزشي از دادهها با برچسبگذاري قبلي نياز است (يادگيري ماشين نظارتي). هدف ... ادامه مطلب »
پردازش متن
دسته بندی متن با استفاده از درخت تصمیم
دستهبندي متن شامل نسبت دادن اسناد به يکي از چند گروه از پيش تعيين شده است. براي نايل شدن به اين هدف اسناد ورودي توسط يک مجموعه از مشخصات[1] که معمولاً خصوصيات[2] ناميده ميشود توصيف ميشوند. برخلاف خوشهبندي[3] که شامل آموزش بدون نظارت است، در دستهبندي يک مجموعه آموزشي از دادهها با برچسبگذاري قبلي نياز است (يادگيري ماشين نظارتي). هدف ... ادامه مطلب »
بازيابي اطلاعات
معناي عبارت بازيابي اطلاعات ميتواند بسيار وسيع باشد. فقط لازم است يک کارت اعتباري از کيف پول خود خارج کنيد و از آن استفاده کنيد. با اين کار شما نوعي بازيابي اطلاعات انجام دادهايد. در هر حال بعنوان يک شاخه مطالعاتي آکادميک، بازيابي اطلاعات ميتواند بصورت زير تعريف شود: “بازيابي اطلاعات عبارتست از کشف اجزاي (معمولاً اسناد) يک طبيعت بدون ... ادامه مطلب »
ابزارهاي MATLAB براي بازيابي اطلاعات
سيستم بازيابي اطلاعات[1] در مجموعه سند[2]هايي که به فرمتهاي گوناگون در پايگاه داده وجود دارد (حال اين پايگاه داده ممکن است پايگاه دادة رابطه اي مستقل[3] يا پايگاه دادة شبکهاي ابر متن[4] مثل اينترنت باشد)، به دنبال اطلاعات مطلوب کاربر ميگردد. جستجوي اطلاعات به دو صورت امکان پذير است: نگاه کردن کلي[5] : در مواردي است که خواستة کاربر دقيق ... ادامه مطلب »
برچسب زنی بخش های سخن (POS)
در دستور زبان، بخش های سخن، طبقه بندی هایی زبانی از کلمات هستند که رفتار نحوی یک قسمت از جمله را بیان می دارند. به طور عموم، تمامی زبان ها دو بخش سخن فعل و اسم را دارند. بقیه بخش های سخن در زبان-های مختلف، متفاوت می باشند. از جمله مهم ترین بخش های سخن در زبان فارسی اسم، ضمیر، ... ادامه مطلب »