پروپوزال نظرکاوی ادامه مطلب »
نتیجه جستجو برای : برچسب
کد استفاده از کتابخانه های ابزارهای پردازش متن فارسی
کد استفاده از کتابخانه های ابزارهای پردازش متن فارسی در این کد که به زبان سی شارپ نوشته شده است چگونگی استفاده از کتابخانه های ابزارهای پردازش متن فارسی زیر آورده شده است: – نرمالسازی متون فارسی – Normalizer – تشخیص جملات – Sentence Spliter – تشخیص کلمات – Tokenizer – ریشه یابی کلمات – Stemmer – برچسب زنی نحوی کلمات ... ادامه مطلب »
کلمات کلیدی مرتبط با پردازش متن، خلاصه سازی، ترجمه ماشینی
کاربران اینترنت با جستجوی کلمات کلیدی زیر در موتورهای جستجو، به جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه هدایت شده اند. در صورتیکه نیاز به هر کدام از مطالب مرتبط با کلمات کلیدی زیر دارید بر روی آن کلیک نمایید تا مطالب منتشر شده در جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه مرتبط با ... ادامه مطلب »
کلمات کلیدی مرتبط با وب معنایی، آنتولوژی و پروتج
کاربران اینترنت با جستجوی کلمات کلیدی زیر در موتورهای جستجو، به جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه هدایت شده اند. در صورتیکه نیاز به هر کدام از مطالب مرتبط با کلمات کلیدی زیر دارید بر روی آن کلیک نمایید تا مطالب منتشر شده در جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه مرتبط با ... ادامه مطلب »
پیکره فارسی تحلیل احساس سِنتیپِرس
کد داده: D3940423a | ثبت در مرجع: ۲۴ تیر ۱۳۹۴ | تعداد بازدید: ۶۰۲ پیکره سِنتیپِرس شامل مجموعهای از جملات فارسی با برچسبهای حاوی بار معنایی است که در پردازش زبان طبیعی و به طور مشخص در زمینه تحلیل احساس یا عقیدهکاوی کاربرد دارد. با توجه به ویژگیهای این پیکره، میتوان آن را در نوع خود اولین پیکره تحلیل احساس ... ادامه مطلب »
پیکره – دادگان تلفنی اعداد متصل
کد داده: D3930414a | ثبت در مرجع: ۱۵ تیر ۱۳۹۳ | تعداد بازدید: ۲۱۸۸ دادگان تلفنی اعداد متصل زبان فارسی شامل دادههای ضبطشده تلفنی از اعداد فارسی به صورت متصل است و مشتمل بر ۱۱۰ گوینده میباشد كه هر یك تقریبا ۷۰ رشته عددی را بیان كردهاند. هر رشته عددی جداگانه بر چسبدهی شده است. آزمایشهای متنوعی كه به وسیله ... ادامه مطلب »
پیکره فارسی ۱۹۸۴
کد داده: D3930213a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۳ | تعداد بازدید: ۲۶۴۰ برای تهیه پیکره فارسی ۱۹۸۴ که در در چارچوب MULTEXT-East تولید شده است، رمان ۱۹۸۴ جرج اورول به عنوان متن اصلی انتخاب شده و نسخه فارسی این کتاب برای اضافه کردن زبان فارسی به این چارچوب حاشیهنویسی شده است. این پیکره که از ۱۱۰۰۰۰ توکن، ۱۱۲۶۶ ... ادامه مطلب »
پیکره – پایگاه دادههای زبان فارسی [منتشر نشده]
کد داده: D3921014a | ثبت در مرجع: ۱۴ دی ۱۳۹۲ | تعداد بازدید: ۲۴۹۵ پایگاه دادههای زبان فارسی مجموعهای است از متون مختلف فارسی که بخشی از آن دارای نشانهگذاریهایی از جمله شناسنامه متن، برچسبهای دستوری، آوایی، ریشهای و معنایی است. این دادگان که در پژوهشگاه علوم انسانی و مطالعات فرهنگی تهیه شده است مجهز به نرمافزارهای اختصاصی جستجو، تقطیع ... ادامه مطلب »
پیکره بیجنخان
کد داده: D3920916a | ثبت در مرجع: ۱۶ آذر ۱۳۹۲ | تعداد بازدید: ۲۳۷۴ پیکره بیجنخانی مجموعهای است از متون فارسی شامل بیش از ۲میلیون و ۶۰۰هزار کلمه که با ۵۵۰ نوع برچسب POS برچسبگذاری شدهاند. این پیکره که در پژوهشکده پردازش هوشمند علائم تهیه شده است همچنین شامل بیش از ۴۳۰۰ تگ موضوعی چون سیاسی، تاریخی و … برای ... ادامه مطلب »
پیکره درختی وابستگی فارسی اوپسالا
کد داده: D3920404a | ثبت در مرجع: ۱۰ تیر ۱۳۹۲ | تعداد بازدید: ۱۹۸۲ پیکره درختی وابستگی فارسی اوپسالا (UPDT) مجموعهای است از جملات فارسی که در آن روابط نحوی کلمات بر مبنای دستور وابستگی مشخص شده است. این پیکره که در دانشگاه اوپسالای سوئد تهیه شده است، حاوی ۶.۰۰۰ جمله برگفته از پیکره فارسی اوپسالا (UPC – نسخهای تغییریافته ... ادامه مطلب »
پیکره قرآنی فرقان
کد داده: D3920326a | ثبت در مرجع: ۲۹ خرداد ۱۳۹۲ | تعداد بازدید: ۲۰۱۴ پیکره متنی و زیرساختی که تحت عنوان «پیکره فرقان» برای قرآن کریم تولید گردیده است، حاصل بهرهگیری از سامانهای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیادهسازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه اطلاعات قرآنی، ... ادامه مطلب »
پیکره – دادگان درختی فارسی در چارچوب دستور ساخت سازهای هستهبنیان
کد داده: D3920320a | ثبت در مرجع: ۲۱ خرداد ۱۳۹۲ | تعداد بازدید: ۱۷۹۷ دادگان درختی فارسی در چارچوب دستور ساخت سازهای هستهبنیان (HPSG) مجموعهای است شامل بیش از ۱۰۰۰ جمله برچسبخورده با اطلاعات نحوی. ازجمله ویژگیهای دستور ساخت سازهای هستهبنیان این است که علاوه بر ارائه توصیف ساختاری سلسله مراتبی سازهها، دانش واژگانی واژهها مورد استفاده قرار میگیرد، و ... ادامه مطلب »
پیکره – فارسدات تلفنی
کد داده: D3920124c | ثبت در مرجع: ۲۵ فروردین ۱۳۹۲ | تعداد بازدید: ۱۴۳۹ دادگان فارسدات تلفنی (TFarsDat)، مجموعهای از عبارات و جملات است که توسط گویندگان فارسیزبان از مناطق مختلف کشور از طریق خط تلفن بیان شده است. این دادگان در سطح واج (آوا) با دقت میلیثانیه تقطیع و برچسبدهی شده و بصورت فایلهای مجزا ذخیره گردیده است. تهیه این ... ادامه مطلب »
پیکره – فارسدات
کد داده: D3920124a | ثبت در مرجع: ۲۵ فروردین ۱۳۹۲ | تعداد بازدید: ۲۲۰۷ دادگان فارسدات (FarsDat)، مجموعهای از عبارات و جملات است که توسط گویندگان فارسیزبان از مناطق مختلف کشور بیان شده است. این دادگان در سطح واج (آوا) با دقت میلیثانیه تقطیع و برچسبدهی شده و بصورت فایلهای مجزا ذخیره گردیده است. این دادگان، به عنوان دادگان استاندارد ... ادامه مطلب »
پیکره – پیکره متنی زبان فارسی
کد داده: D3920121a | ثبت در مرجع: ۲۳ فروردین ۱۳۹۲ | تعداد بازدید: ۲۵۳۰ پیکره متنی زبان فارسی، مجموعهای از متون نوشتاری و گفتاری زبان فارسی به صورت رسمی است که از منابع واقعی همچون روزنامهها، سایتها و مستنداتِ از قبل تایپ شده، جمعآوری شده، تصحیح گردیده و برچسب خورده است. حجم این دادگان حدوداً ۱۰۰ میلیون کلمه است و ... ادامه مطلب »
پیکره – مجموعه همشهری (نسخه ۲)
کد داده: D3920117a | ثبت در مرجع: ۲۰ فروردین ۱۳۹۲ | تعداد بازدید: ۲۰۶۹ مجموعه همشهری پیکرهای است حاوی ۳۱۸ هزار سند مربوط به اخبار سالهای ۱۳۷۵ تا ۱۳۸۶ که با خزش (Crawl) وبسایت همشهری و چندین مرحله پیشپردازش و برچسبگذاری حاصل آمده است. همه اسناد مجموعه همشهری دارای برچسب «Cat» هستند که نشان میدهد هر سند در چه ردهای ... ادامه مطلب »