کد داده: D3940317a | ثبت در مرجع: ۱۷ خرداد ۱۳۹۴ | تعداد بازدید: ۷۵۹ وردنت فارسی حوزه فاوا مجموعهای است شامل بیش از ۳۰.۰۰۰ مدخل واژگانی در حوزه تخصصی فاوا از مقولههای اسم، فعل، صفت و قید. در این وردنت علاوه بر روابط درون-مقولهای، روابط میان-مقولهای نیز مفاهیم را بهم پیوند میدهد و علاوه بر ویژگیهای در نظر گرفته شده ... ادامه مطلب »
نتیجه جستجو برای : Process
پیکره مجموعه افعال تصریفشده فارسی
کد داده: D3930317a | ثبت در مرجع: ۱۸ خرداد ۱۳۹۳ | تعداد بازدید: ۲۵۴۳ دادگان «مجموعه افعال تصریفشده فارسی» مجموعهایست که به گردآوری مصادر مختلف فارسی در پیکرههای بیجنخان، همشهری، تبکورپ و چند منبع دیگر پرداخته است. این مصادر در صیغههای مختلف صرف شدهاند و ویژگیهای مختلف آنها از جمله بن ماضی، بن مضارع، زمان، شخص، شمار، نمود و … ... ادامه مطلب »
پیکره فارسی ۱۹۸۴
کد داده: D3930213a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۳ | تعداد بازدید: ۲۶۴۰ برای تهیه پیکره فارسی ۱۹۸۴ که در در چارچوب MULTEXT-East تولید شده است، رمان ۱۹۸۴ جرج اورول به عنوان متن اصلی انتخاب شده و نسخه فارسی این کتاب برای اضافه کردن زبان فارسی به این چارچوب حاشیهنویسی شده است. این پیکره که از ۱۱۰۰۰۰ توکن، ۱۱۲۶۶ ... ادامه مطلب »
دادگان گفتار لهجهدار سهند [منتشر نشده]
کد داده: D3930116a | ثبت در مرجع: ۱۶ فروردین ۱۳۹۳ | تعداد بازدید: ۲۰۹۸ دادگان گفتار لهجهدار سهند مجموعهای است شامل گفتار ضبطشده با ۵ لهجه مختلف که جهت پژوهش در حوزه پردازش گفتار و به ویژه در تشخیص لهجه در گفتار به کار میرود. برای تهیه این مجموعه که در دانشگاه صنعتی سهند تولید شده است، گفتار ۴۰ نفر ... ادامه مطلب »
پیکره – پرسیکا (پیکره متون خبری)
کد داده: D3921115a | ثبت در مرجع: ۱۶ بهمن ۱۳۹۲ | تعداد بازدید: ۳۳۱۷ پرسیکا پیکرهای است حاوی متون خبری برگرفته از خبرگزاری ایسنا. متون این پیکره در یازده طبقه موضوعی شامل ورزشی، اقتصادی، فرهنگی، مذهبی، تاریخی، سیاسی، علمی، اجتماعی، آموزشی، حقوق قضایی، بهداشت طبقهبندی شدهاند و پیشپردازشهایی به منظور قابل استفاده بودن در کاربردهای مختلف پردازش زبان طبیعی و ... ادامه مطلب »
پیکره بیجنخان
کد داده: D3920916a | ثبت در مرجع: ۱۶ آذر ۱۳۹۲ | تعداد بازدید: ۲۳۷۴ پیکره بیجنخانی مجموعهای است از متون فارسی شامل بیش از ۲میلیون و ۶۰۰هزار کلمه که با ۵۵۰ نوع برچسب POS برچسبگذاری شدهاند. این پیکره که در پژوهشکده پردازش هوشمند علائم تهیه شده است همچنین شامل بیش از ۴۳۰۰ تگ موضوعی چون سیاسی، تاریخی و … برای ... ادامه مطلب »
پیکره نور [منتشر نشده]
کد داده: D3920811a | ثبت در مرجع: ۱۱ آبان ۱۳۹۲ | تعداد بازدید: ۱۷۳۵ پیکره نور مجموعهای است عظیم از متون اسلامی که عمدتاً به زبان عربی و فارسی نوشته شدهاند. متون مربوط به بیش از ۴ هزار کتاب عربی (بیش از یک میلیارد کلمه) و بیش از ۲ هزار کتاب فارسی (بیش از ۶۰۰ میلیون کلمه) و همچنین بالغ ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی پیام
کد داده: D3920713a | ثبت در مرجع: ۱۴ مهر ۱۳۹۲ | تعداد بازدید: ۲۴۸۴ پیکره موازی انگلیسی-فارسی پیام مجموعهای است از جملات فارسی و انگلیسی که از مستندات دوزبانه وب استخراج شدهاند. در این پیکره که حاوی حدود صدهزار جمله موازی است، همترازی به شکل دستی و در سطح جمله انجام گرفته است. متون مورد استفاده در این پیکره موازی ... ادامه مطلب »
پیکره – مجموعه ارقام دستنویس هدی
کد داده: D3920411a | ثبت در مرجع: ۱۷ تیر ۱۳۹۲ | تعداد بازدید: ۱۹۸۲ مجموعه ارقام دستنویس هدی مجموعه بزرگی از ارقام دستنویس فارسی است که مشتمل بر ۱۰۲۳۵۳ نمونه دستنوشته سیاه سفید میباشد. این مجموعه طی انجام یک پروژه کارشناسی ارشد در دانشگاه تربیت مدرس برای بازشناسی فرمهای دستنویس تهیه شده است. دادههای این مجموعه از حدود ۱۲۰۰۰ فرم ثبت ... ادامه مطلب »
پیکره درختی وابستگی فارسی اوپسالا
کد داده: D3920404a | ثبت در مرجع: ۱۰ تیر ۱۳۹۲ | تعداد بازدید: ۱۹۸۲ پیکره درختی وابستگی فارسی اوپسالا (UPDT) مجموعهای است از جملات فارسی که در آن روابط نحوی کلمات بر مبنای دستور وابستگی مشخص شده است. این پیکره که در دانشگاه اوپسالای سوئد تهیه شده است، حاوی ۶.۰۰۰ جمله برگفته از پیکره فارسی اوپسالا (UPC – نسخهای تغییریافته ... ادامه مطلب »
پیکره قرآنی فرقان
کد داده: D3920326a | ثبت در مرجع: ۲۹ خرداد ۱۳۹۲ | تعداد بازدید: ۲۰۱۴ پیکره متنی و زیرساختی که تحت عنوان «پیکره فرقان» برای قرآن کریم تولید گردیده است، حاصل بهرهگیری از سامانهای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیادهسازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه اطلاعات قرآنی، ... ادامه مطلب »
پیکره – دادگان درختی فارسی در چارچوب دستور ساخت سازهای هستهبنیان
کد داده: D3920320a | ثبت در مرجع: ۲۱ خرداد ۱۳۹۲ | تعداد بازدید: ۱۷۹۷ دادگان درختی فارسی در چارچوب دستور ساخت سازهای هستهبنیان (HPSG) مجموعهای است شامل بیش از ۱۰۰۰ جمله برچسبخورده با اطلاعات نحوی. ازجمله ویژگیهای دستور ساخت سازهای هستهبنیان این است که علاوه بر ارائه توصیف ساختاری سلسله مراتبی سازهها، دانش واژگانی واژهها مورد استفاده قرار میگیرد، و ... ادامه مطلب »
پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران
کد داده: D3920230a | ثبت در مرجع: ۳۱ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۷۶۱ پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران (UTPECC) از دو مجموعه اخبار متفاوت از دو مبدأ مجزا یعنی اخبار فارسی خبرگزاری همشهری و اخبار انگلیسی خبرگزاری بیبیسی ساخته شده است. همچنین برای همترازی اسناد این دو زبان، علاوه بر تاریخ انتشار اخبار، شباهت محتوای اسناد نیز در نظر گرفته ... ادامه مطلب »
پیکره – تنزیل (پیکره قرآنی)
کد داده: D3920228a | ثبت در مرجع: ۲۸ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۵۳۸ تنزیل یک پروژه بینالمللی قرآنی است که با هدف فراهمسازی نسخهای دقیق از قرآن کریم ایجاد شده است. در این پروژه علاوه بر ارائه نسخه رقومی دقیقی از متن قرآن، بالغ بر ۱۰۰ ترجمه از قرآن کریم برای بیش از ۴۰ زبان دنیا از جمله ۱۱ ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی میزان
کد داده: D3920221a | ثبت در مرجع: ۲۲ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۳۱۲۱ پیکره میزان مجموعهای است حاوی بیش از ۱ میلیون جمله از متون انگلیسی (اغلب در حوزه ادبیات کلاسیک) و ترجمه این جملات به فارسی که توسط دبیرخانه شورای عالی اطلاعرسانی تهیه شده است. از این پیکره میتوان در کاربردهای مختلف پردازش زبان طبیعی و به ویژه در ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی تهران
کد داده: D3920214a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۶۵۸ پیکره موازی انگلیسی فارسی تهران (TEP) مجموعهای است حاوی بیش از ششصدهزار جمله همترازشده انگلیسی و فارسی که از زیرنویس ۱۶۰۰ فیلم استخراج شدهاند. این پیکره در آزمایشگاه پردازش زبان طبیعی دانشگاه تهران تهیه شده است و در ماشینهای ترجمه و دیگر سیستمهای پردازش زبان طبیعی ... ادامه مطلب »