خانه -> بایگانی برچسب : Language (برگه 3)

بایگانی برچسب : Language

پیکره – مجموعه همشهری (نسخه ۲)

14 نوامبر 2015 دیدگاه‌ها برای پیکره – مجموعه همشهری (نسخه ۲) بسته هستند

دانلود, رایگان, دیتاست, پیکره, پردازش, زبان, طبیعی, فارسی, dataset, corpus, persian, Language, processing

کد داده: D3920117a | ثبت در مرجع: ۲۰ فروردین ۱۳۹۲ | تعداد بازدید: ۲۰۶۹ مجموعه همشهری پیکره‌ای است حاوی ۳۱۸ هزار سند مربوط به اخبار سال‌های ۱۳۷۵ تا ۱۳۸۶ که با خزش (Crawl) وب‌سایت همشهری و چندین مرحله پیش‌پردازش و برچسب‌گذاری حاصل آمده است. همه اسناد مجموعه همشهری دارای برچسب «Cat» هستند که نشان می‌دهد هر سند در چه رده‌ای ... ادامه مطلب »

پیکره – فرهنگ ظرفیت نحوی افعال فارسی (نسخه ۳.۰)

13 نوامبر 2015 دیدگاه‌ها برای پیکره – فرهنگ ظرفیت نحوی افعال فارسی (نسخه ۳.۰) بسته هستند

کد داده: D3911212a | ثبت در مرجع: ۲۴ اسفند ۱۳۹۱ | تعداد بازدید: ۳۶۴۸ فرهنگ ظرفیت نحوی افعال فارسی مجموعه‌ای است حاوی اطلاعات مربوط به ظرفیت نحوی بیش از ۴۵۰۰ فعل در زبان فارسی. در این فرهنگ، متمم‌های اجباری و اختیاری انواع فعل‌های ساده، مرکب، پیشوندی و عبارات فعلی مشخص شده است. فراوانی فعل‌های مرکب در زبان فارسی، نیاز به ... ادامه مطلب »

پیکره – فرهنگ املایی خط فارسی

12 نوامبر 2015 دیدگاه‌ها برای پیکره – فرهنگ املایی خط فارسی بسته هستند

کد داده: D3911203c | ثبت در مرجع: ۰۴ اسفند ۱۳۹۱ | تعداد بازدید: ۱۹۷۴ داده حاضر نسخه رقومی فرهنگ املايى خطّ فارسى براساس دستور خطّ فارسی مصوّب فرهنگستان زبان و ادب فارسی است. ازآنجاكه به‌خاطر سپردن تمام قواعدى كه در دستور خطّ فارسى مصوّب فرهنگستان زبان و ادب فارسى آمده براى همگان امكان‌پذير نيست، و ازسوى‌ديگر، عموم نويسندگان، اعم از ... ادامه مطلب »

پیکره – دادگان صوتی هجاهای فارسی

11 نوامبر 2015 دیدگاه‌ها برای پیکره – دادگان صوتی هجاهای فارسی بسته هستند

کد داده: D3911203a | ثبت در مرجع: ۰۵ اسفند ۱۳۹۱ | تعداد بازدید: ۱۸۹۰ دادگان گفتاری حاضر شامل حدود ۵۸۰۰ فایل صوتی هجاهای زبان فارسی است که توسط پژوهشکده پردازش هوشمند علائم برای یک برنامه بازسازی گفتار فارسی از نوع بازسازی گفتار به شیوه همگذاری طراحی شده است. بخش اعظم هجا‌ها از صورت واجنویسی‌شده دادگان بزرگ زبان فارسی گفتاری «فارسدات بزرگ» ... ادامه مطلب »

پیکره – فرهنگ جامع واژگان مترادف و متضاد زبان فارسی

10 نوامبر 2015 35 نظرات

کد داده: D3911124a | ثبت در مرجع: ۲۷ بهمن ۱۳۹۱ | تعداد بازدید: ۳۶۴۱۰ این داده نسخه رقومی فرهنگ جامع واژگان مترادف و متضاد زبان فارسی (تألیف فرج‌الله خداپرستی) است که متشکل از ۱۵۰۰۰ مدخل، ۲۷۴۰۰ حوزه معنایی و ۱۳۵۰۰۰ واژه می‌باشد. نحوه تنظیم لغات الفبایی بوده و در برابر هر واژه ابتدا مترادفات آن و سپس واژگان متضاد آمده ... ادامه مطلب »

پیکره – مجموعه داده عروض (نسخۀ ۲.۰۰)

09 نوامبر 2015 دیدگاه‌ها برای پیکره – مجموعه داده عروض (نسخۀ ۲.۰۰) بسته هستند

کد داده: D3911108c | ثبت در مرجع: ۰۹ بهمن ۱۳۹۱ | تعداد بازدید: ۶۵۶۲ دادگان عروض مجموعه‌ای است شامل حدود ۱۳۰۰ بیت از اشعار مولانا و حافظ به همراه کد وزن آن‌ها که می‌تواند جهت تشخیص خودکار وزن عروضی اشعار فارسی مورد استفاده قرار گیرد. مالکیت معنوی: دبیرخانه شورای عالی اطلاع‌رسانی شرایط استفاده: – اطلاعات ارجاع: – محمدمهدی مجیری، و ... ادامه مطلب »

پیکره – بانک اطلاعات حروف گسسته دست‌نویس فارسی

08 نوامبر 2015 دیدگاه‌ها برای پیکره – بانک اطلاعات حروف گسسته دست‌نویس فارسی بسته هستند

کد داده: D3911108a | ثبت در مرجع: ۰۹ بهمن ۱۳۹۱ | تعداد بازدید: ۱۵۰۹ به دلیل روند رو به گسترش تولید و استفاده از سیستم‌های مبتنی بر نویسه‌خوانی نوری (OCR)، اهمیت وجود بانک‌های اطلاعات تصاویر نوشتار فارسی بیش از پیش احساس می‌شود. این بانک‌های اطلاعاتی هم به منظور توسعه و آموزش الگوریتم‌های آموزش‌پذیر و هم به منظور ارزیابی سیستم‌های ساخته ... ادامه مطلب »

پیکره – فرهنگ طیفی زبان فارسی

07 نوامبر 2015 دیدگاه‌ها برای پیکره – فرهنگ طیفی زبان فارسی بسته هستند

کد داده: D3911105c | ثبت در مرجع: ۰۷ بهمن ۱۳۹۱ | تعداد بازدید: ۲۰۵۶ این داده نسخه رقومی کتاب «فرهنگ طیفی» با طبقه‌بندی بر اساس ارتباط معنایی ۴۵ هزار لغت و ۹۲ هزار معنی و تداعی آن لغات است. کتاب فرهنگ طیفی نخستین تزاروس طبقه‌بندی لغات و اصطلاحات رایج زبان فارسی است که به صورت طبقه‌بندی شده، ذیل ۹۹۱ مقوله ... ادامه مطلب »

پیکره – واژگان زایای زبان فارسی

06 نوامبر 2015 دیدگاه‌ها برای پیکره – واژگان زایای زبان فارسی بسته هستند

کد داده: D3911105a | ثبت در مرجع: ۰۷ بهمن ۱۳۹۱ | تعداد بازدید: ۲۵۰۵ واژگان زایای زبان فارسی واژگانی است شامل حدود ۵۵هزار مدخل که هر مدخل دارای اطلاعات مربوط به صورت نوشتاری واژه در خط فارسی، ساخت واجی، مقولهٔ واژگانی، الگوی تکیه، و بسامد واژه می‌باشد. برای تهیهٔ واژگان زایا، یک پیکره متنی ۱۰میلیون کلمه‌ای ملاک استخراج واژه‌ها قرار ... ادامه مطلب »

پیکره – پیکره وابستگی نحوی زبان فارسی (نسخه ۱.۱.۱)

05 نوامبر 2015 دیدگاه‌ها برای پیکره – پیکره وابستگی نحوی زبان فارسی (نسخه ۱.۱.۱) بسته هستند

کد داده: D3911103a | ثبت در مرجع: ۲۷ اسفند ۱۳۹۳ | تعداد بازدید: ۴۰۶۲ پیکره وابستگی نحوی زبان فارسی مجموعه‎ای است شامل حدود ۳۰ هزار جمله برچسب‌خورده با اطلاعات نحوی و ساخت‌واژی. این پیکره می‌تواند به عنوان زیرساختی اساسی در پردازش رایانه‌ای زبان فارسی به کار رود. مهم‌ترین دلائل استفاده از دستور وابستگی در این پیکره نحوی عبارتند از: نتایج ... ادامه مطلب »

معرفی سایت دادگان

04 نوامبر 2015 21 نظرات

مرجع دادگان زبان فارسی (dadegan.ir) با هدف ارائه متمرکز پیکره‌ها و سایر داده‌های زبانی موجود برای زبان فارسی راه‌اندازی شده است. داده‌های عرضه شده در این مرجع تخصصی می‌توانند برای اهداف پردازش رایانه‌ای زبان و مطالعات زبان‌شناختی مورد استفاده قرار بگیرند. امروزه روش‌های آماری و مبتنی بر یادگیری ماشینی کاربرد فراوانی در پردازش زبان طبیعی و ایجاد سامانه‌هایی چون سامانه‌های ... ادامه مطلب »

کتاب پردازش زبان طبیعی و متن کاوی Natural Language Processing and Text Mining

25 می 2015 دیدگاه‌ها برای کتاب پردازش زبان طبیعی و متن کاوی Natural Language Processing and Text Mining بسته هستند

Natural, Language, Processing, and, Text, Mining, Pdf, , Kao.Steve, R.Poteet, Download, Springer, دانلود, کتاب , پردازش, زبان, طبیعی, متن, کاوی

Natural Language Processing and Text Mining حجم فایل: 3.69 مگابایت By Anne Kao, Steve R. Poteet (Author) : 14 Download : 3.79 Mb File Size : Pdf Extension : General Topic : 272 Pages : Springer Publisher : 1st Edition. Edition : English Language : 2007 Year : 184628175X, 9781846281754, 9781846287541 ISBN نمایش کتاب در Amazon.com شناسنامه کتاب به زبان فارسی عنوان: ... ادامه مطلب »

برگه 3 از 3«1 23