ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. Tokenizer: ابزاري براي شکستن يک متن بر اساس واحدهاي با معني مانند کلمه، پاراگراف، نمادهاي معنادار مانند space و tab و … . ل ... ادامه مطلب »
بایگانی برچسب : ابزار
ابزارهای لازم برای پردازش متن در زبان فارسی
ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. براي ايجاد اين ابزار بايد ابتدا تمامي کاراکترها، نماد ها و احياناً قواعد دستوري که باعث شکسته شدن جملات مي شوند، شناسايي گردند. با توجه به ... ادامه مطلب »
ابزارهای مولد تحليلگر لغوي و تحليلگر نحوي Lex و Yacc
معرفي دو ابزار توليد تحليلگر لغوي و تحليلگر نحوي از هنگامي كه تحليگر هاي لغوي و تجزيه كننده ها با دست نوشته مي شدند ، ]كم كم و ناخودآگاه[ تحليلگرهاي لغوي و تجزيه-كننده ها به طراحي يكساني رسيدند و طراحان فهميدند كه آنها را مي توان با دادن شرحي از رفتار مورد نظرشان ، به طور خودكار توليد كرد . ... ادامه مطلب »
ابزارهاي MATLAB براي بازيابي اطلاعات
سيستم بازيابي اطلاعات[1] در مجموعه سند[2]هايي که به فرمتهاي گوناگون در پايگاه داده وجود دارد (حال اين پايگاه داده ممکن است پايگاه دادة رابطه اي مستقل[3] يا پايگاه دادة شبکهاي ابر متن[4] مثل اينترنت باشد)، به دنبال اطلاعات مطلوب کاربر ميگردد. جستجوي اطلاعات به دو صورت امکان پذير است: نگاه کردن کلي[5] : در مواردي است که خواستة کاربر دقيق ... ادامه مطلب »