1- مفاهیم پایه پردازش زبان طبیعی کتاب Foundations of Statistical Natural Language Processing این کتاب در سال 1999 توسط انتشارات MIT منتشر شده و یکی از منابع اصلی پردازش زبان طبیعی در دانشگاهها است. این کتاب شامل 680 صفحه در قالب 4 بخش و 16 فصل هست. بخش اول، مربوط به بیان مقدمات، مفاهیم و پیشنیازهای پردازش زبان طبیعی است. ... ادامه مطلب »
نتیجه جستجو برای : corpus
پیکره زبانآموز فارسی پی.ال.سی [منتشر نشده]
کد داده: D3941121a | ثبت در مرجع: ۲۲ بهمن ۱۳۹۴ | تعداد بازدید: ۱۸۴۳ پیکرهٔ زبانآموز فارسی با عنوان PLC (برای Persian Learner Corpus) مجموعهای است شامل تعداد ۱۵۰ متن نگارشی که به صورت نمونه و تصادفی از میان بایگانی انشاهای فارسیآموزانی که از کشورهای مختلف با سابقهٔ زبان اول مختلف (ترکی، هندی، انگلیسی، عربی، چینی و …) بودهاند انتخاب ... ادامه مطلب »
پیکره موازی فارسی انگلیسی متون مذهبی [منتشر نشده]
کد داده: D3941119a | ثبت در مرجع: ۱۹ بهمن ۱۳۹۴ | تعداد بازدید: ۱۱۱۱۰ پیکرهٔ حاضر مجموعهای است از متون مذهبی شامل قرآن، انجیل، رسالههای عملیه، سایر کتب مذهبی، وبگاههای مذهبی و … به دو زبان فارسی و انگلیسی که در سطح جمله موازیسازی شدهاند. حجم پیکره حدود ۲۰ میلیون واژه برای هر زبان است. مالکیت معنوی: علی بیکیان، مهران ... ادامه مطلب »
پیکره فارسی روز [منتشر نشده]
کد داده: D3941117a | ثبت در مرجع: ۱۷ بهمن ۱۳۹۴ | تعداد بازدید: ۱۷۹۸ پیکرهٔ فارسی روز پیکرهای خام، یکزبانه و پیوسته، شامل ۱۲۷ متن فارسی است که تمام آنها بین سالهای ۱۳۸۰ تا ۱۳۹۲ نوشته شدهاند و اغلب از میان داستانهای کوتاه و رمانها انتخاب شدهاند. این پیکره برای تألیف اثری با عنوان «فرهنگ فارسی روز» گردآوری شده و ... ادامه مطلب »
دانلود رایگان مقالات کامپیوتر – سری دوم
دانلود رایگان مقالات انگلیسی رشته مهندسی کامپیوتر ۱ – A new fuzzy membership assignment and model selection approach based on dynamic class centers for fuzzy SVM family using firefly algorithm (چکیده) ۲ – Performance Analysis of PSO and GA Algorithms in Order to Classifying EEG Data (چکیده) ۳ – Overload Mitigation Mechanism for VoIP Networks: A Transport Layer Approach Based on ... ادامه مطلب »
کلمات کلیدی مرتبط با دانلود مقاله، تحقیق، سمینار و پایان نامه- سری چهارم
کاربران اینترنت با جستجوی کلمات کلیدی زیر در موتورهای جستجو، به جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه هدایت شده اند. در صورتیکه نیاز به هر کدام از مطالب مرتبط با کلمات کلیدی زیر دارید بر روی آن کلیک نمایید تا مطالب منتشر شده در جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه مرتبط با ... ادامه مطلب »
پیکره فارسی ارزیابی سامانههای تقلبیاب
کد داده: D3940531a | ثبت در مرجع: ۳۱ مرداد ۱۳۹۴ | تعداد بازدید: ۲۹۵ پیکره حاضر که با هدف ارزیابی سامانههای تقلبیاب تهیه شده است مشتمل بر بیش از ۱۵۰۰ سند فارسی از ویکیپدیا است که ۴۱۱ نمونه تقلب در آنها گنجانده شده است. در قسمتهای حاوی تقلب فرایندهایی چون جابجایی کلمات، حذف و اضافه نمودن کلمات و جایگزین نمودن ... ادامه مطلب »
پیکره – پی.سی.ای.سی ۲۰۰۸ (پیکره مرجع ضمیر)
کد داده: D3940406a | ثبت در مرجع: ۰۶ تیر ۱۳۹۴ | تعداد بازدید: ۶۲۹ پیکره پی.سی.ای.سی ۲۰۰۸ (PCAC-2008 Persian Coreferentially Annotated Corpus) مجموعهای است شامل ۳۱ متن برگرفته از پیکره بیجنخان که در آن نزدیکترین مرجع اسمی ۲۰۷۹ ضمیر مشخص شده است. دسترسی به اطلاعات مربوط به مرجع ضمیر در بسیاری از کاربردهای پردازش زبان طبیعی چون ترجمه ماشینی، پرسش ... ادامه مطلب »
پیکره – پاسخ (پیکره استاندارد سامانههای خلاصهساز)
کد داده: D3930615a | ثبت در مرجع: ۱۵ شهریور ۱۳۹۳ | تعداد بازدید: ۲۱۵۹ پیکره «پاسخ» اولین پیکره متنی برای ارزیابی خلاصهسازی تکسندی و خلاصهسازی چندسندی است که توسط آزمایشگاه فناوری وب دانشگاه فردوسی مشهد و با همکاری سازمان فناوری اطلاعات ایران تولید گردیده. این پیکره مشتمل بر دو مجموعه تکسندی و چندسندی است. در تولید این مجموعه سعی شده ... ادامه مطلب »
پیکره فارسی ۱۹۸۴
کد داده: D3930213a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۳ | تعداد بازدید: ۲۶۴۰ برای تهیه پیکره فارسی ۱۹۸۴ که در در چارچوب MULTEXT-East تولید شده است، رمان ۱۹۸۴ جرج اورول به عنوان متن اصلی انتخاب شده و نسخه فارسی این کتاب برای اضافه کردن زبان فارسی به این چارچوب حاشیهنویسی شده است. این پیکره که از ۱۱۰۰۰۰ توکن، ۱۱۲۶۶ ... ادامه مطلب »
پیکره – پرسیکا (پیکره متون خبری)
کد داده: D3921115a | ثبت در مرجع: ۱۶ بهمن ۱۳۹۲ | تعداد بازدید: ۳۳۱۷ پرسیکا پیکرهای است حاوی متون خبری برگرفته از خبرگزاری ایسنا. متون این پیکره در یازده طبقه موضوعی شامل ورزشی، اقتصادی، فرهنگی، مذهبی، تاریخی، سیاسی، علمی، اجتماعی، آموزشی، حقوق قضایی، بهداشت طبقهبندی شدهاند و پیشپردازشهایی به منظور قابل استفاده بودن در کاربردهای مختلف پردازش زبان طبیعی و ... ادامه مطلب »
پیکره بیجنخان
کد داده: D3920916a | ثبت در مرجع: ۱۶ آذر ۱۳۹۲ | تعداد بازدید: ۲۳۷۴ پیکره بیجنخانی مجموعهای است از متون فارسی شامل بیش از ۲میلیون و ۶۰۰هزار کلمه که با ۵۵۰ نوع برچسب POS برچسبگذاری شدهاند. این پیکره که در پژوهشکده پردازش هوشمند علائم تهیه شده است همچنین شامل بیش از ۴۳۰۰ تگ موضوعی چون سیاسی، تاریخی و … برای ... ادامه مطلب »
پیکره نور [منتشر نشده]
کد داده: D3920811a | ثبت در مرجع: ۱۱ آبان ۱۳۹۲ | تعداد بازدید: ۱۷۳۵ پیکره نور مجموعهای است عظیم از متون اسلامی که عمدتاً به زبان عربی و فارسی نوشته شدهاند. متون مربوط به بیش از ۴ هزار کتاب عربی (بیش از یک میلیارد کلمه) و بیش از ۲ هزار کتاب فارسی (بیش از ۶۰۰ میلیون کلمه) و همچنین بالغ ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی پیام
کد داده: D3920713a | ثبت در مرجع: ۱۴ مهر ۱۳۹۲ | تعداد بازدید: ۲۴۸۴ پیکره موازی انگلیسی-فارسی پیام مجموعهای است از جملات فارسی و انگلیسی که از مستندات دوزبانه وب استخراج شدهاند. در این پیکره که حاوی حدود صدهزار جمله موازی است، همترازی به شکل دستی و در سطح جمله انجام گرفته است. متون مورد استفاده در این پیکره موازی ... ادامه مطلب »
پیکره دوزبانه فارسی-انگلیسی امیرکبیر [منتشر نشده]
کد داده: D3920418a | ثبت در مرجع: ۲۶ تیر ۱۳۹۲ | تعداد بازدید: ۱۶۵۶ پیکره دوزبانه فارسی-انگلیسی امیرکبیر (AFEC) پیکرهای موازی از جملات فارسی و انگلیسی است که در آزمایشگاه فناوری زبان انسانی دانشگاه صنعتی امیرکبیر و با حمایت پژوهشگاه فضای مجازی به عنوان یکی از خروجیهای پروژه ترجمه ماشینی تهیه شده است. برای تهیهٔ این مجموعه که حاوی حدود ۱۵میلیون ... ادامه مطلب »
پیکره قرآنی فرقان
کد داده: D3920326a | ثبت در مرجع: ۲۹ خرداد ۱۳۹۲ | تعداد بازدید: ۲۰۱۴ پیکره متنی و زیرساختی که تحت عنوان «پیکره فرقان» برای قرآن کریم تولید گردیده است، حاصل بهرهگیری از سامانهای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیادهسازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه اطلاعات قرآنی، ... ادامه مطلب »