نمونه پروپوزال کارشناسی ارشد: معناگرایی در ارزيابي خودکار خلاصه سازهاي ماشيني انگليسي و فارسي با بهره گیری از شبکه واژگان Title:Automatic SemanticEvaluation of English and Persian Text Summarizerwith using WordNet تعريف مساله، پیشینه، اهداف و سوالات تحقيق امروزه با رشد چشمگير حجم مستندات منتشر شده در وب و نياز اساسي به نگهداري، دسته بندي، بازيابي و پردازش ماشيني و سريع ... ادامه مطلب »
پردازش متن
کتاب در زمینه ترجمه ماشینی – machin translation
در این بخش تعدای از کتب مرجع و بسیار خوب در زمینه پردازش متن جهت مطالعه دوستان معرفی میگردد. لازم به ذکر است که این کتب از سایت آزمايشگاه فناوري وب دانشگاه فردوسی مشهد اخذ شده است. Machine Translation A SURVEY OF MACHINE TRANSLATION.pdf KNOWLEDGE REPRESENTATION and MACHINE TRANSLATION.pdf Language Resources for the Semantic Web – perspectives for Machine Translation.pdf PersianSMT A ... ادامه مطلب »
کتاب در زمینه خلاصه سازی متن- Text Summarization
در این بخش تعدای از کتب مرجع و بسیار خوب در زمینه پردازش متن جهت مطالعه دوستان معرفی میگردد. لازم به ذکر است که این کتب از سایت آزمايشگاه فناوري وب دانشگاه فردوسی مشهد اخذ شده است. Text Summarization A Survey on Automatic Text Summarization.pdf A Trainable Document Summarizer.pdf Automated Multi-document Summarization in NeATS.pdf Extracting Sentence Segments for Text summarization.pdf FarsiSum – ... ادامه مطلب »
کتاب در زمینه پردازش متن- Text Mining
در این بخش تعدای از کتب مرجع و بسیار خوب در زمینه پردازش متن جهت مطالعه دوستان معرفی میگردد. لازم به ذکر است که این کتب از سایت آزمايشگاه فناوري وب دانشگاه فردوسی مشهد اخذ شده است. Text Mining An Introduction to Latent Semantic Analysis.pdf The Text Mining HandBook.pdf Computational Linguistics and Intelligent text processing.pdf Emerging Technologies of Text Mining.pdf Indexing by ... ادامه مطلب »
نحوه استفاده از wordnet در برنامه هاي جاوا
دراين گزارش فني تلاش داريم شما را با چگونگي دسترسي به خدمات wordnet از محيط جاوا آشنا نماييم . آموزش اين مساله از مرحله نصب نسخه آفلاين wordnet آغاز شده و تا مرحله کد نويسي يک نمونه ساده ادامه مي يابد. گام اول: دانلود و نصب WordNet برای دریافت یک نسخه از برنامه WordNet (شامل دیکشنری لغات و یک ... ادامه مطلب »
کتاب پردازش زبان طبیعی و متن کاوی Natural Language Processing and Text Mining
Natural Language Processing and Text Mining حجم فایل: 3.69 مگابایت By Anne Kao, Steve R. Poteet (Author) : 14 Download : 3.79 Mb File Size : Pdf Extension : General Topic : 272 Pages : Springer Publisher : 1st Edition. Edition : English Language : 2007 Year : 184628175X, 9781846281754, 9781846287541 ISBN نمایش کتاب در Amazon.com شناسنامه کتاب به زبان فارسی عنوان: ... ادامه مطلب »
کارگاه آشنایی با مبانی و چالش های نظرکاوی
چکیده اعتقادات و درک ما از واقعیات و تصمیمگیریهای ما تا حد قابل توجهی وابسته به طرز تفکر و دیدگاههای سایر افراد است. اغلب افراد در فرایند تصمیمگیری (بخصوص تصمیمگیری درباره پدیدههای ناشناخته و جدید) نیاز به دانستن نظرات دیگر افرادی که با آن پدیده آشنایی دارند یا قبلاً آن پدیده را تجربه کردند، دارند. این موضوع برای مشتریان ساده ... ادامه مطلب »
کارگاه پردازش زبان طبیعی
اولین گام در پردازش هر نوع داده ای شناسایی ماهیت آن است. به همین دلیل در مقدمه زبان طبیعی به مرور نظریه های فلسفه زبان خواهیم پرداخت. این نظریه ها به ما کمک می نمایند تا دریافت مناسبی از مشکلات روش های حل مسئله پیدا نماییم. اما برداشتی که از زبان طبیعی داریم با آنچه در پردازش آن رخ می ... ادامه مطلب »
نوشتن PLUGIN فارسی برای نرم افزار پردازش متن GATE
GATE یک نرم افزار پردازش متن است که توسط تیم طراحی دانشگاه Sheffield ساخته شده است. پردازشی که توسط این نرم افزار صورت می گیرد براساس اجزاء موجود در آن، به صورت ترتیبی، صورت می گیرد. لذا قابلیت این وجود دارد که بخش های مختلف توسط کاربران و برنامه نویسان توسعه یابد و بعنوان یک جزء جدا به آن اضافه ... ادامه مطلب »
متنكاوي موضوعي رايانهاي قرآن كريم
متنکاوي موضوعي قرآن کريم، رويکردي جديد در «پردازش ارتباطات معنايي» ميان آيات قرآن کريم است، که با استفاده از ابزارهاي دادهکاوي رايانهاي به اين کاوش ميپردازد. با استفاده از مباني تفسيري علامه طباطبايي در نگاه موضوعي و نگاه غايتمحور، يک پيکرة موضوعي از آيات قرآن تشکيل داديم که شامل بخشي تفسيري (براي ارزيابي نتايج) و بخشي تشخيصي (با کدگذاري موضوعي ... ادامه مطلب »
موتورهای جستجوی معنایی، شاخص گذاری دادههای RDF و هرز صفحات در وب اسناد
ضرورت موتورهای جستجو یک واقعیت انکارناپذیر است زیرا موتورهای جستجو دروازههای ورود به وب هستند و برای قابل استفاده کردن اطلاعات انبوه روی وب ضروری هستند. از دیدگاه کاربر، یک موتور جستجوی ایدهآل برای وب، باید قادر باشد تا جواب مستقیم یک پرسش را بیابد. موتور جستجوی گوگل با ارائه یک واسط خیلی ساده و مدل تراکنش ساده بر اساس ... ادامه مطلب »
روشهای سرقت ادبیو الگوریتمهای آن
با توجه به طبقه بندیMaurer و همکارانش ]27[ روش های تشخیص سرقت ادبی به سه دسته تبدیل می شود.در دسته اول تلاش برای بدست آوردن سبک نگارش نویسنده و پیدا کردن هرگونه تغییر ناسازگار در این سبک است.ساختار دسته دوم بر اساس مقایسه چندین سند و شناسایی قطعات مشترک است، دسته سوم یک سند را به عنوان ورودی می گیرد ... ادامه مطلب »
خوشه بندی اسناد متنی مبتنی بر مفاهیم همسایگی و شباهت معنایی
متن کاوی فناوری ایجاد شده جهت کنترل داده های متنی در حال رشد است که در جهت برچینی اطلاعات معنی دار از متون زبان طبیعی تلاش می کند. متن کاوی یعنی جستجوی الگوها در متن غیرساخت یافته و برای کشف خودکار دانش مورد علاقه یا مفید از متن نیمه ساخت یافته استفاده می-شود [Tan 2005]. متن کاوی تقریبا معادل با ... ادامه مطلب »
خلاصه سازی چکیده ای مبتنی بر مشابهت جملات
خلاصه سازی خودکار متون همزمان با رشد روز افزون اسناد و اطلاعات بیش از پیش مورد توجه علاقه مندان حوزه پردازش زبان طبیعی قرار گرفته است. از این میان خلاصه سازی چند سنده که در آن چندین سند به عنوان ورودی دریافت می گردد، مورد توجه زیادی قرار گرفته است. در بسیاری از روش ها تنها گزیده ای از جملات ... ادامه مطلب »
كشف سرقت ادبی – تشخیص پلاگاریسم (Plagiarism)
1. كشف سرقت ادبی در متون فارسی با كمك الگوریتم SimHash خلاصه مقاله: دسترسی آسان به وب، پایگاه داده های بزرگ و به طور كلی ارتباطات از راه دور باعث شده كه سرقت ادبی به یك مشكل بزرگ برای ناشران، محققان و موسسات آموزشی تبدیل شود. در زبان انگلیسی این مسئله به طور جدی مورد اهمیت بوده و ابزارهای ... ادامه مطلب »
خلاصه ساز خودكار متون فارسی – روش ها و الگوریتم ها
مقاله اول: خلاصه سازي متون فارسي با استفاده از هستي شناسي و خوشه بندي خلاصه مقاله: يكي از مشكلات اصلي در تحقيق روي خلاصه سازي خودكار، تفسير معنايي نادرست از سند است. استفاده از دامنه دانش منحصر بفرد مي تواند اين مشكل را به طور قابل توجهي كم كند. در اين مقاله ما يك روش استخراجي مبتني بر هستي شناسي ... ادامه مطلب »