مجموعههای متنی ابزارهای مهمی برای پیشبرد تحقیقات در تعدادی از شاخههای علوم کامپیوتر مانند بازیابی اطلاعات (Information Retrieval)، زبانشناسی پیکرهای (Corpus Linguistics) و زبانشناسی محاسباتی (Computational Linguistics) هستند. مجموعه آزمایش همشهری یکی از معتبرترین این منابع در زبان فارسی است. از این مجموعه در همایشهای معتبر بینالمللی Persian@CLEF2008 و Persian@CLEF2009 استفاده شده است. لازم به ذکر است که سایت قدیمی ... ادامه مطلب »
نتیجه جستجو برای : متون فارسی
نمونه پروپوزال کارشناسی ارشد: معناگرایی در ارزيابي خودکار خلاصه سازهاي ماشيني انگليسي و فارسي با بهره گیری از شبکه واژگان
نمونه پروپوزال کارشناسی ارشد: معناگرایی در ارزيابي خودکار خلاصه سازهاي ماشيني انگليسي و فارسي با بهره گیری از شبکه واژگان Title:Automatic SemanticEvaluation of English and Persian Text Summarizerwith using WordNet تعريف مساله، پیشینه، اهداف و سوالات تحقيق امروزه با رشد چشمگير حجم مستندات منتشر شده در وب و نياز اساسي به نگهداري، دسته بندي، بازيابي و پردازش ماشيني و سريع ... ادامه مطلب »
نمونه پروپوزال کارشناسی ارشد: معناگرایی در ارزيابي خودکار خلاصه سازهاي ماشيني انگليسي و فارسي با بهره گیری از شبکه واژگان
نمونه پروپوزال کارشناسی ارشد: معناگرایی در ارزيابي خودکار خلاصه سازهاي ماشيني انگليسي و فارسي با بهره گیری از شبکه واژگان Title:Automatic SemanticEvaluation of English and Persian Text Summarizerwith using WordNet ادامه مطلب »
كشف سرقت ادبی – تشخیص پلاگاریسم (Plagiarism)
1. كشف سرقت ادبی در متون فارسی با كمك الگوریتم SimHash خلاصه مقاله: دسترسی آسان به وب، پایگاه داده های بزرگ و به طور كلی ارتباطات از راه دور باعث شده كه سرقت ادبی به یك مشكل بزرگ برای ناشران، محققان و موسسات آموزشی تبدیل شود. در زبان انگلیسی این مسئله به طور جدی مورد اهمیت بوده و ابزارهای ... ادامه مطلب »
كشف سرقت ادبی – تشخیص پلاگاریسم (Plagiarism)
سرقت ادبی , اثر انگشت , فاصله همینگ , shingling , simHash , بازیابی متن , تشخیص سرقت علمی , ادبی بیرونی , سرقت علمی , ادبی , شباهت متون , تشخیص سرقت علمی , اخلاق در پژوهش , جعل پیشینه , سرقت ادبی , انتحال , پلاگاریسم , تشخیص پلاگاریستم متن دو زبانه , تحلیل شباهت , تحلیل مورفولوژیك , مدل فضای برداری (vsm) , تشخیص پلاگاریسم دوزبانه , تحلیل محتوی , تحلیل اطلاعات آماری , بازیابی اطلاعات , شباهت متون , یادگیری ماشین , دسته بندی متون , طبقه بندی متون , پردازش زبان های طبیعی , هستانشناسی , طبقهبندی , تشابه معنایی , وبمعنایی , همرخدادی , ترجمه ماشینی , روش های نظارت شده , فاصله اقلیدسی , شباهت cosine , طبقه بند مبتنی بر یادگیری جمعی , خوشه بندی , معیار شباهت فازی , اثرانگشت , RareChunk , SPEX , winnowing , بازیابی اطلاعات , تشابه متن , ریخت شناسی , وندها , زبان فارسی ادامه مطلب »
ترجمه ماشینی مبتنی بر آنتولوژی
ترجمه ماشینی مبتنی بر آنتولوژی – Ontology based translation machine در ابتدا به طور خلاصه به تعریف پردازش زبانهای طبیعی، محدودیت ها، موانع موجود و همچنین کارکردهای مهم پردازش زبان های طبیعی پرداخته می شود. پس از آن مفهوم ترجمه و ترجمه ماشینی که یکی از مهم ترینکارکردهای پردازش زبان های طبیعی می باشد، بیان می گردد. اجزای مورد نیاز ... ادامه مطلب »
ترجمه ماشینی مبتنی بر آنتولوژی
ترجمه ماشینی مبتنی بر آنتولوژی - Ontology based translation machine ادامه مطلب »
خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم
خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم چكیده: با گسترش روز افزون حجم داده ها و اطلاعات، خلاصه سازی خودکار متون نیز با استقبال چشم گیر محققین روبرو شده است. در سال های اخیر خلاصه سازی چندسندی با اقبال بیشتری مواجه بوده است. یک سیستم خلاصه سازی چندسندی استخراجی، خلاصه سازی است که چندین سند را به عنوان ورودی ... ادامه مطلب »
خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم
خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم ادامه مطلب »
ترجمه ماشینی – بخش دوم
فعالیت و کار ترجمه سابقة بسیار طولانی دارد. بعضیها معتقدند که اولین کاری که بشر کرده ترجمه است؛ اگر ترجمه را به معنی برگرداندن فرض کنیم کلام در واقع برگردان اندیشه است. این اولین قدمی است که بشر برای ترجمه برداشته است. در واقع یکی از استراتژیهای ترجمه، از هر زبانی که بخواهید ترجمه کنید، به هدف و نوع متنی ... ادامه مطلب »
ترجمه ماشینی – بخش اول
ربات ها به زودی جایگزین مترجمین انسانی می شوند… دراين وبلاگ در این مبحث ، در ابتدا به طور خلاصه به تعریف پردازش زبانهای طبیعی، محدودیت ها، موانع موجود و همچنین کارکردهای مهم پردازش زبان های طبیعی پرداخته می شود. پس از آن مفهوم ترجمه و ترجمه ماشینی که یکی از مهم تریت کارکردهای پردازش زبان های طبیعی می باشد، ... ادامه مطلب »
پردازش متن
ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. براي ايجاد اين ابزار بايد ابتدا تمامي کاراکترها، نماد ها و احياناً قواعد دستوري که باعث شکسته شدن جملات مي شوند، شناسايي گردند. با توجه به ... ادامه مطلب »
بهترین کتابها در زمینه پردازش زبان طبیعی
1- مفاهیم پایه پردازش زبان طبیعی کتاب Foundations of Statistical Natural Language Processing این کتاب در سال 1999 توسط انتشارات MIT منتشر شده و یکی از منابع اصلی پردازش زبان طبیعی در دانشگاهها است. این کتاب شامل 680 صفحه در قالب 4 بخش و 16 فصل هست. بخش اول، مربوط به بیان مقدمات، مفاهیم و پیشنیازهای پردازش زبان طبیعی است. ... ادامه مطلب »
فاکتورهای موثر در افزایش رتبه سایت در موتور جستجوی گوگل
در این مقاله قصد داریم آخرین و جدیدترین عوامل موثر در افزایش جایگاه سایت ها در موتور جستجوی گوگل که در واقع به سئوی سایت ها کمک می کند را بررسی نماییم. فاکتورهای موثر در رتبه گوگل بر طبق یک میلیون نتیجۀ جستجو هیچ شکی نیست که تمام کسانی که در فضای آنلاین فعال هستند، میخواهند بدانند که کدام عوامل و فاکتورهای سئو ... ادامه مطلب »
مجموعه محک وب داتآیآر
کد داده: D3941015a | ثبت در مرجع: ۱۶ دی ۱۳۹۴ | تعداد بازدید: ۲۰۸۵ بازیابی اطلاعات وب (Web Information Retrieval) یک زمینه تحقیقاتی است که در آن از فنون حوزه بازیابی اطلاعات برای برطرفسازی یک نیاز اطلاعاتی در محیط وب استفاده میشود. در این نوع بازیابی علاوه بر متون میتوان از اطلاعات موجود در فراداده (Meta Data) و ساختار پیوندی ... ادامه مطلب »
مجموعه داده استاندارد وبلاگهای ایران
کد داده: D3941014a | ثبت در مرجع: ۱۵ دی ۱۳۹۴ | تعداد بازدید: ۲۱۷۵ مجموعه داده استاندارد وبلاگهای ایران (irBlogs) جهت ایجاد بستری مناسب برای تحقیق و ارائهٔ الگوریتم در زمینهٔ شبکههای اجتماعی ایرانی تولید شده است. این مجموعه شامل متون برگرفته از بیش از ۶۰۰ هزار وبلاگ (نزدیک به ۵ میلیون پست) است و گراف روابط افراد نیز برای ... ادامه مطلب »