این کتاب برای اولین بار در سال 2010 و ویرایش دومش در سال 2014 چاپ شده است. تقریبا تمام مفاهیم متن کاوی به خصوص در مرحله پیش پردازش در این کتاب به خوبی توضیح داده شده است و کدهای آماده بسیاری در پایتون برای آنها ارائه شده است. Python 3 Text Processing with NLTK 3 Cookbook Title: Python 3 Text Processing ... ادامه مطلب »
بایگانی برچسب : پیش پردازش
مستند توضیحات ابزارهای لازم برای پردازش متن در زبان فارسی
ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. Tokenizer: ابزاري براي شکستن يک متن بر اساس واحدهاي با معني مانند کلمه، پاراگراف، نمادهاي معنادار مانند space و tab و … . ل ... ادامه مطلب »
ابزارهای لازم برای پردازش متن در زبان فارسی
ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. براي ايجاد اين ابزار بايد ابتدا تمامي کاراکترها، نماد ها و احياناً قواعد دستوري که باعث شکسته شدن جملات مي شوند، شناسايي گردند. با توجه به ... ادامه مطلب »