عنوان دیتاست : مجموعه داده توییت های فارسی برای تشخیص شایعه دانشگاه خواجه نصیر PRTD_KNTU ( Persian Rumor Tweets Dataset _ KNTU) گروه : شبکه اجتماعی توضیحات : این مجموعه شامل 3598049 توییت فارسی جمع اوری شده از شبکه اجتماعی توییتر است که در آن 4345 توییت شایعه به وسیله ی کاربر انسانی مشخص شده است. تعداد کاربران ارسال کننده ی توییت ها 111981 ... ادامه مطلب »
نتیجه جستجو برای : file
مجموعه صفات دارای برچسب قطبیت (لِکسی پرس)
کد داده: D3951016 | ثبت در مرجع: ۱۷ دی ۱۳۹۵ | تعداد بازدید: ۵۶۳ لغتنامه احساس لِکسی پرس (LexiPers)، شامل زیر مجموعهای از واژگان نسخه دوم فارسنت است که با روشی خودکار و با سه برچسب مثبت، منفی و خنثی برچسبگذاری شدهاند. فاز اول این پروژه در حال حاضر به اتمام رسیده و طی فازهای بعدی، کیفیت برچسبهای فعلی بهبود ... ادامه مطلب »
پیکره واژگان فارسی دارای برچسب قطبیت
کد داده: D3950208 | ثبت در مرجع: ۰۸ اردیبهشت ۱۳۹۵ | تعداد بازدید: ۲۳۵۵ پیکره واژگان فارسی دارای برچسب قطبیت که در آزمایشگاه سیستمهای هوشمند اطلاعات دانشگاه تهران از دو مجموعه داده تشکیل شده است: ۱. مجموعه استخراج شده از صفتهای برچسب خورده فارسی: این مجموعه از روی مجموعه صفتهای زبان فارسی استخراج شده از فارسنت ساخته شده است. هر ... ادامه مطلب »
پیکره چندزبانه رایانامه
کد داده: D3950204 | ثبت در مرجع: ۰۴ اردیبهشت ۱۳۹۵ | تعداد بازدید: ۱۵۵۹ پیکره چندزبانه رایانامهها برای تشخیص ریسمانهای گفتگوی چندزبانه در آزمایشگاه سیستمهای هوشمند اطلاعات دانشگاه تهران تهیه شده است. نام این پیکره «Multilingual-BC3» است که در حقیقت یک پیکرهٔ ساختگی چندزبانه است که حاصل ترجمه بخشی از پیکره تکزبانه BC3، توسط عامل انسانی است. پیکره اولیه BC3 ... ادامه مطلب »
پیکره گروههای نحوی استاندارد برای تجزیه سطحی جملات فارسی [منتشر نشده]
کد داده: D3941124a | ثبت در مرجع: ۲۴ بهمن ۱۳۹۴ | تعداد بازدید: ۲۰۳۶ پیکرهٔ حاضر شامل تعداد ۸۴۰۰ جملهٔ برگرفته از پیکرهٔ متنی زبان فارسی است که در قالب استاندارد تجزیه نحوی سطحی یا همان فرمت IOB برچسبگذاری شده است. گروههای برچسبخورده در این پیکره به ترتیب فراوانی عبارتند از گروه اسمی، گروه حرف اضافه، گروه فعلی، گروه حرف ... ادامه مطلب »
پیکره زبانآموز فارسی پی.ال.سی [منتشر نشده]
کد داده: D3941121a | ثبت در مرجع: ۲۲ بهمن ۱۳۹۴ | تعداد بازدید: ۱۸۴۳ پیکرهٔ زبانآموز فارسی با عنوان PLC (برای Persian Learner Corpus) مجموعهای است شامل تعداد ۱۵۰ متن نگارشی که به صورت نمونه و تصادفی از میان بایگانی انشاهای فارسیآموزانی که از کشورهای مختلف با سابقهٔ زبان اول مختلف (ترکی، هندی، انگلیسی، عربی، چینی و …) بودهاند انتخاب ... ادامه مطلب »
پیکره موازی فارسی انگلیسی متون مذهبی [منتشر نشده]
کد داده: D3941119a | ثبت در مرجع: ۱۹ بهمن ۱۳۹۴ | تعداد بازدید: ۱۱۱۱۰ پیکرهٔ حاضر مجموعهای است از متون مذهبی شامل قرآن، انجیل، رسالههای عملیه، سایر کتب مذهبی، وبگاههای مذهبی و … به دو زبان فارسی و انگلیسی که در سطح جمله موازیسازی شدهاند. حجم پیکره حدود ۲۰ میلیون واژه برای هر زبان است. مالکیت معنوی: علی بیکیان، مهران ... ادامه مطلب »
پیکره فارسی روز [منتشر نشده]
کد داده: D3941117a | ثبت در مرجع: ۱۷ بهمن ۱۳۹۴ | تعداد بازدید: ۱۷۹۸ پیکرهٔ فارسی روز پیکرهای خام، یکزبانه و پیوسته، شامل ۱۲۷ متن فارسی است که تمام آنها بین سالهای ۱۳۸۰ تا ۱۳۹۲ نوشته شدهاند و اغلب از میان داستانهای کوتاه و رمانها انتخاب شدهاند. این پیکره برای تألیف اثری با عنوان «فرهنگ فارسی روز» گردآوری شده و ... ادامه مطلب »
واژگان زایای زبان کردی سورانی [منتشر نشده]
کد داده: D3941111a | ثبت در مرجع: ۱۱ بهمن ۱۳۹۴ | تعداد بازدید: ۱۷۶۱ واژگان زایای زبان کردی سورانی به صورت نیمهخودکار استخراج شده است و شامل حدود ۳۵ هزار مدخل با ۲۸ برچسب مقولهٔ واژگانی است. واژگان به مجموعهٔ واژههای درون ذهن گویشوران اطلاق میگردد که یکی از منابع مهم در تولید و ساخت فناوریهای پردازش زبان طبیعی مانند ... ادامه مطلب »
پیکره واحدهای اسمی آرمان
کد داده: D3940917a | ثبت در مرجع: ۱۸ آذر ۱۳۹۴ | تعداد بازدید: ۱۶۶۵ تشخیص واحدهای اسمی (یا تشخیص موجودیتهای نامدار) یکی از موضوعات پردازش زبان طبیعی است که نیاز به پیکره دارد. پیکرهٔ واحدهای اسمی آرمان که توسط شرکت آرمان رایان شریف تولید شده است شامل ۴۰۰ هزار کلمه (۴۹۱۷ جمله برگرفته از پیکرهٔ بیجنخان) است و سه ردهٔ ... ادامه مطلب »
آزمایشگاههای داخلی حوزه بازیابی اطلاعات
در این بخش آزمایشگاه هایی که در داخل کشور در حوزه آزمون و ارزیابی خدمات وب به ویژه در حوزه بازیابی اطلاعات و جویشگر به ارائه خدمت می پردازند، معرفی می شوند. آزمایشگاه های حوزه پردازش و بازیابی اطلاعات و خدمات وب ردیف عنوان آزمایشگاه مکان نوع خدمات حوزه کاری فعالیتها آدرس سایت ۱ آزمایشگاه تخصصی فناوری وب دانشگاه فردوسی ... ادامه مطلب »
آزمایشگاههای داخلی حوزه پردازش زبان طبیعی
ردیف عنوان آزمایشگاه مکان نوع خدمات حوزه کاری فعالیت آدرس سایت ۱ آزمایشگاه فناوری زبان انسانی و یادگیری ماشین دانشگاه امیرکبیر تحقیقاتی تخصصی توسعه ابزار توسعه دیتا ست ارزیابی پژوهشی مترجم ماشینی فارسی به انگلیسی و برعکس پیش_پردازشگر متون زبان فارسی ابزار شناسایی موجودیت های اسمی در متون فارسی ابزار ریشهیاب زبان فارسی ابزار برچسب زن مقوله نحوی ابزار نویسهگردانی ... ادامه مطلب »
پرفروش ترین کتابهای مدیریتی از گروه باران
پرفروش ترین کتابهای مدیریتی از گروه مشاوره باران مدیریت استراتژیک برای دنیای واقعی جدیدترین و پرفروش ترین کتاب مشترک شرکت BCG و دانشگاه هاروارد در سال 2015 جنگل استراتژی، مخوف، پیچیده و ترسناک به نظر می رسد. چه بسیار سازمان هایی که در تو در توی این جنگل گم شده اند. این کتاب که با همکاری دانشگاه هاروارد و شرکت ... ادامه مطلب »
دانلود رایگان مقالات کامپیوتر – سری سوم
دانلود رایگان مقالات انگلیسی رشته مهندسی کامپیوتر 351 – Fuzzy Genetic Algorithm Parallelization for Dejong Function Optimization (چکیده) ۳۵۲ – An Ensemble Classifier Approach for Static Signature Verification Based on Multi-Resolution Extracted Features (چکیده) ۳۵۳ – An Effective Slow-Motion Detection Approach for Compressed Soccer Videos (چکیده) ۳۵۴ – Camera parameters estimation in soccer scenes on the basis of points at ... ادامه مطلب »
کلمات کلیدی مرتبط با دانلود مقاله، تحقیق، سمینار و پایان نامه- سری چهارم
کاربران اینترنت با جستجوی کلمات کلیدی زیر در موتورهای جستجو، به جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه هدایت شده اند. در صورتیکه نیاز به هر کدام از مطالب مرتبط با کلمات کلیدی زیر دارید بر روی آن کلیک نمایید تا مطالب منتشر شده در جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه مرتبط با ... ادامه مطلب »
فااسپل: ﺩﺍﺩﻩ ﺍﺭﺯﯾﺎﺑﯽ خطایابهای املایی
کد داده: D3940825a | ثبت در مرجع: ۲۵ آبان ۱۳۹۴ | تعداد بازدید: ۲۸۰ «فااسپل» متشکل از دو ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺑﺮﺍی ﺍﺭﺯﯾﺎﺑﯽ ﺭوﺵهای خطایابی املایی است. گروه اول شامل خطاهای معمول است که از دانشآموزان مدارس و همچنین خطاهای املایی در هنگام تایپ فارسی جمعآوری شدهاند. این گروه شامل ۵۵۰۰ خطا و کلمهٔ تصحیحشده است. گروه دوم شامل ۸۰۰ جفت ... ادامه مطلب »