Warning: Declaration of tie_mega_menu_walker::start_el(&$output, $item, $depth, $args, $id = 0) should be compatible with Walker_Nav_Menu::start_el(&$output, $data_object, $depth = 0, $args = NULL, $current_object_id = 0) in /home/tnt3ir/domains/tnt3.ir/public_html/wp-content/themes/sahifa-wpcity/functions/theme-functions.php on line 1962
دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی | چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی"/>
طبقه بندی موضوعات
جستجوی کلمات کلیدی
دوشنبه , 23 دسامبر 2024
آخرین مطالب
خانه -> دانلود -> چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی

چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی

چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی

در نخستین گام از طراحی و پیاده­سازی ابزار مورد نظر برای محاسبه میزان تشابه متون، بایستی بسیاری از ابزارهای پایه­ای پردازش زبان انگلیسی از ابتدا و با رویکردی اصولی منطبق بر قواعد گرامری و نگارشی زبان انگلیسی طراحی و پیاده­سازی گردد. از جمله­ی این ابزارها می­توان ابزار نرمال­ساز یا یکسان­ساز، ابزار تشخیص دهنده جملات، ابزار تشخیص دهنده لغات، ابزار ریشه­یاب، ابزار برچسب­زن اجزای واژگانی کلام و غیره را نام برد.

  • نرمال­ساز (Normalizer): در ابتدا بايستي همه‌ي نويسه‌هاي (کاراکترهاي) متن با جايگزيني با معادل استاندارد آن يکسان‌سازي گردند.
  • جداکننده کلمات (Tokenizer): با کمک این پردازشگر می­توان کلمات متن را استخراج نمود.
  • حذف کننده کلمات ایست (Stopword Remover): با استفاده از این ابزار می­توان کلمات ایست را حذف نمود.
  • جدا کننده جملات (Sentence Splitter): با کمک این پردازشگر می­توان جملات را از متن استخراج کرد.
  • ریشه­یاب (Stemmer) : وظیفه ریشه­یابی کلمات را بر عهده دارد.
  • برچسب زننده اجزای واژگانی کلام (POS): از این پردازشگر برای برچسب­زنی اجزای واژگانی کلام استفاده می­شود.

در روند هرگونه پردازش روي متن­هاي زبان طبيعي انجام يک سري پيش­پردازش امري اجتناب ناپذیر است. علاوه بر آن، دقت اين پيش­پردازش­ها تاثير بسزايي در فازهاي بعدي نتايج اعمال الگوريتم­ها دارد. هرچقدر که دقت پيش­پردازش بيشتر باشد الگوريتم­ها به نتايج واقعي خود نزديک­تر خواهند شد.

متن­هایی که قرار است از نظر  شباهت با هم سنجیده شوند متون برگزیده از مقالات هستند که در 3 قسمت (عنوان، چکیده، و کلید واژه­ها) تقسیم­بندی شده­اند و هریک از این قسمت­ها باید در تمام مقالات با هم سنجیده شوند. بنابراین سه فایل به عنوان ورودی به نرم­افزار داده می­شود. یک فایل حاوی عناوین مقالات، یک فایل حاوی کلمات کلیدی مقالات و یک فایل هم حاوی چکیده مقالات. در روند ارزیابی، هر کدام از مقالات در سه قسمت عناوین، کلمات کلیدی و چکیده دو به دو با یکدیگر مقایسه گردیده و میانگین وزن­داری از آنها به عنوان نتیجه نهایی ابزار برگردانده می­شود.

فایل اول:

فایل Word – 11 صفحه

—————————————————————————

ابزارهای لازم برای پردازش متن در زبان فارسی

تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد.
Tokenizer: ابزاري براي شکستن يک متن بر اساس واحدهاي با معني مانند کلمه، پاراگراف، نمادهاي معنادار مانند space و tab و … . ل
Named entity recognition: ابزاري براي تشخيص اسامي و نوع آنها اعم از اسامي افراد، اماکن، مقادير عددي و … .
Word-net: مجموعه اي از لغات و ارتباط ميان آنها به لحاظ معنايي.
Stemmer: ابزاري براي ريشه يابي لغات و تشخيص نوع کلمه ساخته شده از آن ريشه (اسم مکان، اسم زمان، حالت فاعلي، مفعولي و …).
Similarity recognition: ابزاري براي تشخيص ميزان شباهت ميان دو عبارت بر اساس پارامترهاي مختلف مانند نوع اسامي مشابه به کار رفته، استفاده از word-net و… .
Chunker: ابزاري براي تشخيص گروه هاي اسمي، فعلي و ….
Semantic role labeler: ابزاري براي تشخيص نقش گرامري کلمه در جمله.
Annotator: ابزاري براي ايجاد يک نمونه از يک آنتولوژي در يک سند داده شده.
Coreference resolution: ابزاري براي تعيين مرجع اسمي يک اسم يا يک ضمير در جملات.
Pos tagger: ابزاري براي مشخص کردن نوع کلمات از قبيل اسم، صفت، قيد، فعل و … .

 

فایل دوم:

فایل Word_  2 صفحه توضیح مختصری در مورد ابزارهای پردازش متن و معرفی ابزارهای موجود و آماده در زبان انگلیسی

—————————————————————————

مرور ادبیات پردازش متن

در این فصل به مرور مفاهیم مرتبط با پایان نامه، پیش نیازهای لازم برای درک مفاهیم مطرح شده و کارهای انجام شده در ارتباط با موضوع پایان نامه می پردازیم. ابتدا تعاریف پایه در پردازش زبان طبیعی ذکر گردیده است. پس از آن، از آنجا که مشابهت معنایی بین اجزای مختلف متن، جایگاه ویژه ای در کاربردهای مختلف پردازش متن دارا می باشد، به معرفی تلاش های انجام شده در زمینه ی محاسبه ی شباهت معنایی کلمات و جملات می پردازیم.
1- مرور ادبیات 2
1-1- تعاریف پایه زبانشناسی 2
1-1-1- زبان فارسی 2
1-1-2- ایست واژهها (Stop words) 4
1-1-3- ریشه‌یابی 4
1-1-4- برچسبزنی بخشهای سخن (POS) 4
1-1-5- پارسر 6
1-1-6- درخت تجزیه 6
1-1-7- برچسب‏زنی نقش معنایی کلمات (SRL) 7
1-1-8- شبکه واژگان 8

فایل سوم:

فایل Word – 10 صفحه

 

 

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی
لیست محصولات مورخ 1399/09/27