توجه شود که در يک مسئله دستهبندي ابتدا بايد هر سند موجود در مجموعه آموزشي داده شده را در متغير مناسبي ذخيره کرد و نام دسته آن سند را که با مشخصه اي خاص مثلا نام سند بدست آورد و سپس تمام توکنهاي سند استخراج و در محل مناسبي ذخيره گردد .حال کلمات توقف را حذف ميشود. چون اين کلمات ... ادامه مطلب »
نتیجه جستجو برای : درخت
دسته بندی متن با استفاده از تئوری بیز
دسته بندی متن با استفاده از تئوری بیز ادامه مطلب »
دسته کننده K نزديکترين مجاور یا KNN
دستهبندي متن شامل نسبت دادن اسناد به يکي از چند گروه از پيش تعيين شده است. براي نايل شدن به اين هدف اسناد ورودي توسط يک مجموعه از مشخصات[1] که معمولاً خصوصيات[2] ناميده ميشود توصيف ميشوند. برخلاف خوشهبندي[3] که شامل آموزش بدون نظارت است، در دستهبندي يک مجموعه آموزشي از دادهها با برچسبگذاري قبلي نياز است (يادگيري ماشين نظارتي). هدف ... ادامه مطلب »
جزوه و اسلایدهای درس طراحی الگوریتم ها
سری اول اسلایدهای درس طراحی الگوریتم ها (با شبه کد های c ++) فصل اول: کارایی ، تحلیل و مرتبه الگوریتم ها فصل دوم: روش تقسیم و حل فصل سوم: برنامه نویسی پویا فصل چهارم: روش حریصانه در طراحی الگوریتم فصل پنجم: راهبرد عقبگرد فصل ششم: راهبرد شاخه و حد فصل هفتم: مقدمه ای بر پیچیدگی محاسباتی مسئله مرتب سازی ... ادامه مطلب »
جزوه و اسلایدهای درس طراحی الگوریتم ها
جزوه و اسلایدهای درس طراحی الگوریتم ها ادامه مطلب »
ارزیابی سیستم های توصیه گر – Evaluation Metrics for Recommendation Systems
سیستم های توصیه گر با بهره گیری از تکنیک های آماری و تکنیک های کشف دانش به منظور توصیه محصولات به کاربران و کاهش مشکلات ناشی از حجم زیاد داده ها به کار گرفته می شوند. ارزیابی کیفیت سیستم های توصیه گر به یک مسئله مهم برای انتخاب بهترین الگوریتم های یادگیری تبدیل شده است. مقایسه ی بین سیستم های ... ادامه مطلب »
خلاصه سازی خودکار متن
خلاصهسازی خودکار متن به عنوان هستهی مرکزی طیف گستردهای از ابزارهای پردازشگر متن مانند خلاصهسازهای ماشینی، سیستمهای تصمیمیار، سیستمهای پاسخ گو، موتورهای جستجو و … از سالها پیش مطرح شده و همواره به عنوان یک موضوع مهم مورد بررسی و تحقیق قرار گرفته است. بنابر تعریف ارائه شده در استاندارد ISO215، خلاصه، “یک بازگویی مختصر از سند” می باشد. خلاصه ... ادامه مطلب »
پردازش متن
ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. براي ايجاد اين ابزار بايد ابتدا تمامي کاراکترها، نماد ها و احياناً قواعد دستوري که باعث شکسته شدن جملات مي شوند، شناسايي گردند. با توجه به ... ادامه مطلب »
برچسب زنی بخش های سخن (POS)
در دستور زبان، بخش های سخن، طبقه بندی هایی زبانی از کلمات هستند که رفتار نحوی یک قسمت از جمله را بیان می دارند. به طور عموم، تمامی زبان ها دو بخش سخن فعل و اسم را دارند. بقیه بخش های سخن در زبان-های مختلف، متفاوت می باشند. از جمله مهم ترین بخش های سخن در زبان فارسی اسم، ضمیر، ... ادامه مطلب »