یکی از چالش های مهم در امر خلاصه سازی متون، بحث ارزیابی روش های ارائه شده است. برای یک ارزیابی مناسب و دقیق، احتیاج به یک مجموعه داده ی مناسب و استاندارد می باشد. در مقالات مختلف از داد های مختلفی تا کنون استفاده شده است که از جمله آنها می توان به مجموعه داده های خبری BBC، CNN، TREC، ... ادامه مطلب »
نتیجه جستجو برای : تحت
دیتاست خلاصه سازی – DUC 2007 dataset Summarizatoin
دانلود دیتاست خلاصه سازی - DUC 2007 dataset Summarizatoin ادامه مطلب »
دیتاست خلاصه سازی – DUC 2003 dataset Summarizatoin
دیتاست خلاصه سازی - DUC 2003 dataset Summarizatoin ادامه مطلب »
ارزیابی سیستم های توصیه گر – Evaluation Metrics for Recommendation Systems
سیستم های توصیه گر با بهره گیری از تکنیک های آماری و تکنیک های کشف دانش به منظور توصیه محصولات به کاربران و کاهش مشکلات ناشی از حجم زیاد داده ها به کار گرفته می شوند. ارزیابی کیفیت سیستم های توصیه گر به یک مسئله مهم برای انتخاب بهترین الگوریتم های یادگیری تبدیل شده است. مقایسه ی بین سیستم های ... ادامه مطلب »
آنتولوژی یا هستان شناسی و ارزیابی آنتولوژی
تکنیکهای معنایی یکی از مهمترین مسائل در دنیای اینترنت میباشند. مسائلی از قبیل قابلیت استفاده مجدد، مجتمعسازی منابع، توصیف معنایی دادهها یا سرویسها، مستلزم به کار بردن آنتولوژی[1] در قراردادهای دو جانبه میباشند. همترازسازی آنتولوژی ها [2]به کشف تشابه بین مولفهها و روابط بین آنتولوژیهای گوناگون می پردازد. همترازسازی، عناصر کلیدی را با تعمیم معنایی ایجاد می کند. در OA باید توجه ویژهای به ... ادامه مطلب »
ترجمه ماشینی – بخش سوم
ترجمه ماشینی _ کارهای فعلی در زبان فارسی در سال 1372، در آزمايشگاه پردازش زبان طبيعي داشنگاه صنعتي شريف، مهرنوش شمس فرد ( 1373 ) سامانه اي به نام دنا طراحي و پياده نمود. در اين سامانه با به كارگيري نظريه وابستگي مفهومي شنك ( 1975 )، جمله هاي فارسي به شبكه اي از مفهوم ها و روابط ميان آنها ... ادامه مطلب »
ترجمه ماشینی – بخش دوم
فعالیت و کار ترجمه سابقة بسیار طولانی دارد. بعضیها معتقدند که اولین کاری که بشر کرده ترجمه است؛ اگر ترجمه را به معنی برگرداندن فرض کنیم کلام در واقع برگردان اندیشه است. این اولین قدمی است که بشر برای ترجمه برداشته است. در واقع یکی از استراتژیهای ترجمه، از هر زبانی که بخواهید ترجمه کنید، به هدف و نوع متنی ... ادامه مطلب »
ترجمه ماشینی – بخش اول
ربات ها به زودی جایگزین مترجمین انسانی می شوند… دراين وبلاگ در این مبحث ، در ابتدا به طور خلاصه به تعریف پردازش زبانهای طبیعی، محدودیت ها، موانع موجود و همچنین کارکردهای مهم پردازش زبان های طبیعی پرداخته می شود. پس از آن مفهوم ترجمه و ترجمه ماشینی که یکی از مهم تریت کارکردهای پردازش زبان های طبیعی می باشد، ... ادامه مطلب »
فناوريهاي وب معنايي
سناريوهاي ذكر شده در بخش 1.2 علمي تخيلي نيستند. براي دستيابي به آنها نيازي به پيشرفت علمي انقلابي نيست. ميتوان به صورت منطقي ادعا نمود كه چالش در پذيرش فناوري و مهندسي است و نه از لحاظ علمي: راهحلهاي جزئي براي همه بخشهاي مهم مساله وجود دارد. در حال حاضر بيشترين احتياجات در زمينههاي مجتمعسازي، استاندارد كردن، توسعه ابزار و ... ادامه مطلب »
Semantic Web یا Data Web یا وب3 یا همون وب معنایی
اول از همه یهتعریف کوچکی از نسخه های قبلی وب داشته باشیم. وب 1 که همون World Wide Web اولیه خودمون بود که سیستم فقط تک کاربره بود و یااصلآ داینامیک نبود که بعد ها تبدیل به داینامیک هم شد. وب 2 که با ظهور تکنولوژی Ajax (تو پرانتز) که خیلی ها هم فکر میکنن به خاطر هیمنAjax بهش میگن وب 2ولی نه به خاطر ... ادامه مطلب »
روش هاي ارزيابي خلاصه ساز ها – بخش دوم
ارزيابي بيروني (جعبه سياه) [2] برخلاف ارزيابي دروني ، در ارزيابي بيروني توجه برروي کاربر نهايي معطوف مي شود .درنتيجه در اين روش ميزان مؤثر بودن و قابليت پذيرش خلاصه هاي توليد شده با بعضي روشها ، مثل ارزيابي رابطه اي يا قابليت فهم در خواندن ، سنجيده مي شود. همچنين اگر خلاصه به نوعي شامل مجموعه دستوراتي باشد يک ... ادامه مطلب »
روش هاي ارزيابي خلاصه ساز ها – بخش اول
يک مرحله تعيين کننده در هر سيستم ، روش ارزيابي و اعتبارسنجي ادعاي بيان شده است . سيستم ها ي پردازش زبان طبيعي نيز از اين قاعده مستثني نيستند. بلکه با توجه به بي قاعدگي هاي زبان انساني ، اثبات منطقي اين پيکره ي بي قاعده ، يک ريسک است. يک رويه متداول براي برقراري ارتباط با اين حقيقت ، ... ادامه مطلب »
پردازش متن
ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. براي ايجاد اين ابزار بايد ابتدا تمامي کاراکترها، نماد ها و احياناً قواعد دستوري که باعث شکسته شدن جملات مي شوند، شناسايي گردند. با توجه به ... ادامه مطلب »
ثبت پیکره قرآنی فرقان در مرجع دادگان زبان فارسی
پیکره متنی و زیرساختی که تحت عنوان «پیکره فرقان» برای قرآن کریم تولید گردیده است، حاصل بهرهگیری از سامانهای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیادهسازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه اطلاعات قرآنی، آماری، متن و ترجمه فارسی و انگلیسی آیات و برچسبگذاری صرفی و نحوی متن ... ادامه مطلب »
یادگیری هستی شناسی Ontology Learning
وب معنایی یک گام مشخص دیگر در زمینه هستی شناسی است. وب معنایی توسعه یافته وب کنونی است که در آن اطلاعات با توجه به معنی به خوبی تعریف شده است. و انسان و کامپیوتر بهتر قادر خواهندبود باهم همکاری کنند. این همکاری می تواند با استفاده از به اشتراک گذاشتن اجزای دانش بدست بیاید و بنابراین هستی شناسی و ... ادامه مطلب »