Process | تعاونی نیرومندسازی تحقیقات

خانه -> نتیجه جستجو برای : Process (برگه 3)

نتیجه جستجو برای : Process

پیکره – وردنت فارسی حوزه فاوا [منتشر نشده]

12 دسامبر 2015 دیدگاه‌ها برای پیکره – وردنت فارسی حوزه فاوا [منتشر نشده] بسته هستند

دانلود, رایگان, دیتاست, پیکره, پردازش, زبان, طبیعی, فارسی, dataset, corpus, persian, Language, processing

کد داده: D3940317a | ثبت در مرجع: ۱۷ خرداد ۱۳۹۴ | تعداد بازدید: ۷۵۹ وردنت فارسی حوزه فاوا مجموعه‌ای است شامل بیش از ۳۰.۰۰۰ مدخل واژگانی در حوزه تخصصی فاوا از مقوله‌های اسم، فعل، صفت و قید. در این وردنت علاوه بر روابط درون-مقوله‌ای، روابط میان-مقوله‌ای نیز مفاهیم را بهم پیوند می‌دهد و علاوه بر ویژگی‌های در نظر گرفته شده ... ادامه مطلب »

پیکره مجموعه افعال تصریف‌شده فارسی

07 دسامبر 2015 دیدگاه‌ها برای پیکره مجموعه افعال تصریف‌شده فارسی بسته هستند

کد داده: D3930317a | ثبت در مرجع: ۱۸ خرداد ۱۳۹۳ | تعداد بازدید: ۲۵۴۳ دادگان «مجموعه افعال تصریف‌شده فارسی» مجموعه‌ایست که به گردآوری مصادر مختلف فارسی در پیکره‌های بی‌جن‌خان، همشهری، تب‌کورپ و چند منبع دیگر پرداخته است. این مصادر در صیغه‌های مختلف صرف ‌شده‌اند و ویژگی‌های مختلف آن‌ها از جمله بن ماضی، بن مضارع، زمان، شخص، شمار، نمود و … ... ادامه مطلب »

پیکره فارسی ۱۹۸۴

06 دسامبر 2015 دیدگاه‌ها برای پیکره فارسی ۱۹۸۴ بسته هستند

کد داده: D3930213a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۳ | تعداد بازدید: ۲۶۴۰ برای تهیه پیکره فارسی ۱۹۸۴ که در در چارچوب MULTEXT-East تولید شده است، رمان ۱۹۸۴ جرج اورول به عنوان متن اصلی انتخاب شده و نسخه فارسی این کتاب برای اضافه کردن زبان فارسی به این چارچوب حاشیه‌نویسی شده است. این پیکره که از ۱۱۰۰۰۰ توکن، ۱۱۲۶۶ ... ادامه مطلب »

دادگان گفتار لهجه‌دار سهند [منتشر نشده]

06 دسامبر 2015 دیدگاه‌ها برای دادگان گفتار لهجه‌دار سهند [منتشر نشده] بسته هستند

کد داده: D3930116a | ثبت در مرجع: ۱۶ فروردین ۱۳۹۳ | تعداد بازدید: ۲۰۹۸ دادگان گفتار لهجه‌دار سهند مجموعه‌ای است شامل گفتار ضبط‌شده با ۵ لهجه مختلف که جهت پژوهش در حوزه پردازش گفتار و به ویژه در تشخیص لهجه در گفتار به کار می‌رود. برای تهیه این مجموعه که در دانشگاه صنعتی سهند تولید شده است، گفتار ۴۰ نفر ... ادامه مطلب »

پیکره – پرسیکا (پیکره متون خبری)

04 دسامبر 2015 دیدگاه‌ها برای پیکره – پرسیکا (پیکره متون خبری) بسته هستند

کد داده: D3921115a | ثبت در مرجع: ۱۶ بهمن ۱۳۹۲ | تعداد بازدید: ۳۳۱۷ پرسیکا پیکره‌ای است حاوی متون خبری برگرفته از خبرگزاری ایسنا. متون این پیکره در یازده طبقه موضوعی شامل ورزشی، اقتصادی، فرهنگی، مذهبی، تاریخی، سیاسی، علمی، اجتماعی، آموزشی، حقوق قضایی، بهداشت طبقه‌بندی شده‌اند و پیش‌پردازش‌هایی به منظور قابل استفاده بودن در کاربردهای مختلف پردازش زبان طبیعی و ... ادامه مطلب »

پیکره بی‌جن‌خان

02 دسامبر 2015 33 نظرات

کد داده: D3920916a | ثبت در مرجع: ۱۶ آذر ۱۳۹۲ | تعداد بازدید: ۲۳۷۴ پیکره بی‌جن‌خانی مجموعه‌ای است از متون فارسی شامل بیش از ۲میلیون و ۶۰۰هزار کلمه که با ۵۵۰ نوع برچسب POS برچسب‌گذاری شده‌اند. این پیکره که در پژوهشکده پردازش هوشمند علائم تهیه شده است همچنین شامل بیش از ۴۳۰۰ تگ موضوعی چون سیاسی، تاریخی و … برای ... ادامه مطلب »

پیکره نور [منتشر نشده]

01 دسامبر 2015 دیدگاه‌ها برای پیکره نور [منتشر نشده] بسته هستند

کد داده: D3920811a | ثبت در مرجع: ۱۱ آبان ۱۳۹۲ | تعداد بازدید: ۱۷۳۵ پیکره نور مجموعه‌ای است عظیم از متون اسلامی که عمدتاً به زبان عربی و فارسی نوشته شده‌اند. متون مربوط به بیش از ۴ هزار کتاب عربی (بیش از یک میلیارد کلمه) و بیش از ۲ هزار کتاب فارسی (بیش از ۶۰۰ میلیون کلمه) و همچنین بالغ ... ادامه مطلب »

پیکره موازی انگلیسی-فارسی پیام

30 نوامبر 2015 دیدگاه‌ها برای پیکره موازی انگلیسی-فارسی پیام بسته هستند

کد داده: D3920713a | ثبت در مرجع: ۱۴ مهر ۱۳۹۲ | تعداد بازدید: ۲۴۸۴ پیکره موازی انگلیسی-فارسی پیام مجموعه‌ای است از جملات فارسی و انگلیسی که از مستندات دوزبانه وب استخراج شده‌اند. در این پیکره که حاوی حدود صدهزار جمله موازی است، همترازی به شکل دستی و در سطح جمله انجام گرفته است. متون مورد استفاده در این پیکره موازی ... ادامه مطلب »

پیکره – مجموعه ارقام دستنویس هدی

26 نوامبر 2015 دیدگاه‌ها برای پیکره – مجموعه ارقام دستنویس هدی بسته هستند

کد داده: D3920411a | ثبت در مرجع: ۱۷ تیر ۱۳۹۲ | تعداد بازدید: ۱۹۸۲ مجموعه ارقام دستنویس هدی مجموعه بزرگی از ارقام دستنویس فارسی است که مشتمل بر ۱۰۲۳۵۳ نمونه دست‌نوشته سیاه سفید می‌باشد. این مجموعه طی انجام یک پروژه کارشناسی ارشد در دانشگاه تربیت مدرس برای بازشناسی فرم‌های دستنویس تهیه شده است. داده‌های این مجموعه از حدود ۱۲۰۰۰ فرم ثبت ... ادامه مطلب »

پیکره درختی وابستگی فارسی اوپسالا

25 نوامبر 2015 دیدگاه‌ها برای پیکره درختی وابستگی فارسی اوپسالا بسته هستند

کد داده: D3920404a | ثبت در مرجع: ۱۰ تیر ۱۳۹۲ | تعداد بازدید: ۱۹۸۲ پیکره درختی وابستگی فارسی اوپسالا (UPDT) مجموعه‌ای است از جملات فارسی که در آن روابط نحوی کلمات بر مبنای دستور وابستگی مشخص شده است. این پیکره که در دانشگاه اوپسالای سوئد تهیه شده است، حاوی ۶.۰۰۰ جمله برگفته از پیکره فارسی اوپسالا (UPC – نسخه‌ای تغییریافته ... ادامه مطلب »

پیکره قرآنی فرقان

24 نوامبر 2015 75 نظرات

کد داده: D3920326a | ثبت در مرجع: ۲۹ خرداد ۱۳۹۲ | تعداد بازدید: ۲۰۱۴ پیکره متنی و زیرساختی که تحت عنوان «پیکره فرقان» برای قرآن کریم تولید گردیده است، حاصل بهره‌گیری از سامانه‌ای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیاده‌سازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه اطلاعات قرآنی، ... ادامه مطلب »

پیکره – دادگان درختی فارسی در چارچوب دستور ساخت سازه‌ای هسته‌بنیان

23 نوامبر 2015 دیدگاه‌ها برای پیکره – دادگان درختی فارسی در چارچوب دستور ساخت سازه‌ای هسته‌بنیان بسته هستند

کد داده: D3920320a | ثبت در مرجع: ۲۱ خرداد ۱۳۹۲ | تعداد بازدید: ۱۷۹۷ دادگان درختی فارسی در چارچوب دستور ساخت سازه‌ای هسته‌بنیان (HPSG) مجموعه‌ای است شامل بیش از ۱۰۰۰ جمله برچسب‌خورده با اطلاعات نحوی. ازجمله ویژگی‌های دستور ساخت سازه‌ای هسته‌بنیان این است که علاوه بر ارائه توصیف ساختاری سلسله مراتبی سازه‌ها، دانش واژگانی واژه‌ها مورد استفاده قرار می‌گیرد، و ... ادامه مطلب »

پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران

22 نوامبر 2015 دیدگاه‌ها برای پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران بسته هستند

کد داده: D3920230a | ثبت در مرجع: ۳۱ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۷۶۱ پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران (UTPECC) از دو مجموعه اخبار متفاوت از دو مبدأ مجزا یعنی اخبار فارسی خبرگزاری همشهری و اخبار انگلیسی خبرگزاری بی‌بی‌سی ساخته شده است. همچنین برای هم‌ترازی اسناد این دو زبان، علاوه بر تاریخ انتشار اخبار، شباهت محتوای اسناد نیز در نظر گرفته ... ادامه مطلب »

پیکره – تنزیل (پیکره قرآنی)

21 نوامبر 2015 دیدگاه‌ها برای پیکره – تنزیل (پیکره قرآنی) بسته هستند

کد داده: D3920228a | ثبت در مرجع: ۲۸ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۵۳۸ تنزیل یک پروژه بین‌المللی قرآنی است که با هدف فراهم‌سازی نسخه‌ای دقیق از قرآن کریم ایجاد شده است. در این پروژه علاوه بر ارائه نسخه رقومی دقیقی از متن قرآن، بالغ بر ۱۰۰ ترجمه از قرآن کریم برای بیش از ۴۰ زبان دنیا از جمله ۱۱ ... ادامه مطلب »

پیکره موازی انگلیسی-فارسی میزان

20 نوامبر 2015 دیدگاه‌ها برای پیکره موازی انگلیسی-فارسی میزان بسته هستند

کد داده: D3920221a | ثبت در مرجع: ۲۲ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۳۱۲۱ پیکره میزان مجموعه‌ای است حاوی بیش از ۱ میلیون جمله از متون انگلیسی (اغلب در حوزه ادبیات کلاسیک) و ترجمه این جملات به فارسی که توسط دبیرخانه شورای عالی اطلاع‌رسانی تهیه شده است. از این پیکره می‌توان در کاربردهای مختلف پردازش زبان طبیعی و به ویژه در ... ادامه مطلب »

پیکره موازی انگلیسی-فارسی تهران

19 نوامبر 2015 دیدگاه‌ها برای پیکره موازی انگلیسی-فارسی تهران بسته هستند

کد داده: D3920214a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۶۵۸ پیکره موازی انگلیسی فارسی تهران (TEP) مجموعه‌ای است حاوی بیش از ششصدهزار جمله هم‌ترازشده انگلیسی و فارسی که از زیرنویس ۱۶۰۰ فیلم استخراج شده‌اند. این پیکره در آزمایشگاه پردازش زبان طبیعی دانشگاه تهران تهیه شده است و در ماشین‌های ترجمه و دیگر سیستم‌های پردازش زبان طبیعی ... ادامه مطلب »

برگه 3 از 5«1 234 5 »