1- مفاهیم پایه پردازش زبان طبیعی کتاب Foundations of Statistical Natural Language Processing این کتاب در سال 1999 توسط انتشارات MIT منتشر شده و یکی از منابع اصلی پردازش زبان طبیعی در دانشگاهها است. این کتاب شامل 680 صفحه در قالب 4 بخش و 16 فصل هست. بخش اول، مربوط به بیان مقدمات، مفاهیم و پیشنیازهای پردازش زبان طبیعی است. ... ادامه مطلب »
بایگانی برچسب : بازیابی اطلاعات
مجموعه محک وب داتآیآر
کد داده: D3941015a | ثبت در مرجع: ۱۶ دی ۱۳۹۴ | تعداد بازدید: ۲۰۸۵ بازیابی اطلاعات وب (Web Information Retrieval) یک زمینه تحقیقاتی است که در آن از فنون حوزه بازیابی اطلاعات برای برطرفسازی یک نیاز اطلاعاتی در محیط وب استفاده میشود. در این نوع بازیابی علاوه بر متون میتوان از اطلاعات موجود در فراداده (Meta Data) و ساختار پیوندی ... ادامه مطلب »
مجموعه داده استاندارد وبلاگهای ایران
کد داده: D3941014a | ثبت در مرجع: ۱۵ دی ۱۳۹۴ | تعداد بازدید: ۲۱۷۵ مجموعه داده استاندارد وبلاگهای ایران (irBlogs) جهت ایجاد بستری مناسب برای تحقیق و ارائهٔ الگوریتم در زمینهٔ شبکههای اجتماعی ایرانی تولید شده است. این مجموعه شامل متون برگرفته از بیش از ۶۰۰ هزار وبلاگ (نزدیک به ۵ میلیون پست) است و گراف روابط افراد نیز برای ... ادامه مطلب »
كشف سرقت ادبی – تشخیص پلاگاریسم (Plagiarism)
1. كشف سرقت ادبی در متون فارسی با كمك الگوریتم SimHash خلاصه مقاله: دسترسی آسان به وب، پایگاه داده های بزرگ و به طور كلی ارتباطات از راه دور باعث شده كه سرقت ادبی به یك مشكل بزرگ برای ناشران، محققان و موسسات آموزشی تبدیل شود. در زبان انگلیسی این مسئله به طور جدی مورد اهمیت بوده و ابزارهای ... ادامه مطلب »
بازيابي اطلاعات
معناي عبارت بازيابي اطلاعات ميتواند بسيار وسيع باشد. فقط لازم است يک کارت اعتباري از کيف پول خود خارج کنيد و از آن استفاده کنيد. با اين کار شما نوعي بازيابي اطلاعات انجام دادهايد. در هر حال بعنوان يک شاخه مطالعاتي آکادميک، بازيابي اطلاعات ميتواند بصورت زير تعريف شود: “بازيابي اطلاعات عبارتست از کشف اجزاي (معمولاً اسناد) يک طبيعت بدون ... ادامه مطلب »