کد داده: D3930518a | ثبت در مرجع: ۱۸ مرداد ۱۳۹۳ | تعداد بازدید: ۵۱۲۷ دسترسی به ابزار پژوهش رواسازی شده برای ارزیابی نوای گفتار (پروسودی) از ملزومات مطالعه گفتار احساسی (عاطفی) است. “پایگاه داده گفتار احساسی زبان فارسی Persian ESD”، اولین مجموعه جامع و معتبر گفتار احساسی برای زبان فارسی است که در دانشگاه Freie Universitaet Berlin ساخته و سپس ... ادامه مطلب »
نتیجه جستجو برای : Log
پیکره مجموعه افعال تصریفشده فارسی
کد داده: D3930317a | ثبت در مرجع: ۱۸ خرداد ۱۳۹۳ | تعداد بازدید: ۲۵۴۳ دادگان «مجموعه افعال تصریفشده فارسی» مجموعهایست که به گردآوری مصادر مختلف فارسی در پیکرههای بیجنخان، همشهری، تبکورپ و چند منبع دیگر پرداخته است. این مصادر در صیغههای مختلف صرف شدهاند و ویژگیهای مختلف آنها از جمله بن ماضی، بن مضارع، زمان، شخص، شمار، نمود و … ... ادامه مطلب »
پیکره فارسی ۱۹۸۴
کد داده: D3930213a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۳ | تعداد بازدید: ۲۶۴۰ برای تهیه پیکره فارسی ۱۹۸۴ که در در چارچوب MULTEXT-East تولید شده است، رمان ۱۹۸۴ جرج اورول به عنوان متن اصلی انتخاب شده و نسخه فارسی این کتاب برای اضافه کردن زبان فارسی به این چارچوب حاشیهنویسی شده است. این پیکره که از ۱۱۰۰۰۰ توکن، ۱۱۲۶۶ ... ادامه مطلب »
پیکره دادگان گفتار احساسی سهند [منتشر نشده]
کد داده: D3921217a | ثبت در مرجع: ۱۸ اسفند ۱۳۹۲ | تعداد بازدید: ۲۰۷۴ دادگان گفتار احساسی سهند مجموعهای است شامل گفتار ضبطشده در ۵ حالت احساسی مختلف که جهت پژوهش در حوزه پردازش گفتار و به ویژه در تشخیص حالت احساسی در گفتار به کار میرود. برای تهیه این مجموعه که در دانشگاه صنعتی سهند تولید شده است، گفتار ... ادامه مطلب »
پیکره بیجنخان
کد داده: D3920916a | ثبت در مرجع: ۱۶ آذر ۱۳۹۲ | تعداد بازدید: ۲۳۷۴ پیکره بیجنخانی مجموعهای است از متون فارسی شامل بیش از ۲میلیون و ۶۰۰هزار کلمه که با ۵۵۰ نوع برچسب POS برچسبگذاری شدهاند. این پیکره که در پژوهشکده پردازش هوشمند علائم تهیه شده است همچنین شامل بیش از ۴۳۰۰ تگ موضوعی چون سیاسی، تاریخی و … برای ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی پیام
کد داده: D3920713a | ثبت در مرجع: ۱۴ مهر ۱۳۹۲ | تعداد بازدید: ۲۴۸۴ پیکره موازی انگلیسی-فارسی پیام مجموعهای است از جملات فارسی و انگلیسی که از مستندات دوزبانه وب استخراج شدهاند. در این پیکره که حاوی حدود صدهزار جمله موازی است، همترازی به شکل دستی و در سطح جمله انجام گرفته است. متون مورد استفاده در این پیکره موازی ... ادامه مطلب »
پیکره – دادگان دایفونی فارسی [منتشر نشده]
کد داده: D3920616a | ثبت در مرجع: ۱۶ شهریور ۱۳۹۲ | تعداد بازدید: ۱۸۷۲ واحد پایه مورد استفاده در دادگان صوتی برای بازسازی رایانهای گفتار باید به گونهای انتخاب شود كه اولاً حجم حافظه معقولی را اشغال كند، یعنی تعداد واحدهای آوایی مطلوب باشد و ثانیاً بتوان گذرهای آوایی را در دادگان پوشش داد. از جمله واحدهایی كه با هدف ... ادامه مطلب »
پیکره – واژگان نحوی و معنایی افعال مرکب فارسی (نسخه ۱.۰)
کد داده: D3920512a | ثبت در مرجع: ۱۲ مرداد ۱۳۹۲ | تعداد بازدید: ۲۴۴۳ واژگان نحوی و معنایی افعال مرکب فارسی (PersPred) مجموعهای است چندزبانه شامل اطلاعات نحوی و معنایی افعال مرکب زبان فارسی، ترجمه انگلیسی و فرانسوی افعال و حداقل یک جمله مثال برای هر فعل. اطلاعات نحوی بر اساس دیدگاه گروس و اطلاعات معنایی بر اساس دیدگاه لوین ... ادامه مطلب »
پیکره درختی وابستگی فارسی اوپسالا
کد داده: D3920404a | ثبت در مرجع: ۱۰ تیر ۱۳۹۲ | تعداد بازدید: ۱۹۸۲ پیکره درختی وابستگی فارسی اوپسالا (UPDT) مجموعهای است از جملات فارسی که در آن روابط نحوی کلمات بر مبنای دستور وابستگی مشخص شده است. این پیکره که در دانشگاه اوپسالای سوئد تهیه شده است، حاوی ۶.۰۰۰ جمله برگفته از پیکره فارسی اوپسالا (UPC – نسخهای تغییریافته ... ادامه مطلب »
پیکره – دادگان درختی فارسی در چارچوب دستور ساخت سازهای هستهبنیان
کد داده: D3920320a | ثبت در مرجع: ۲۱ خرداد ۱۳۹۲ | تعداد بازدید: ۱۷۹۷ دادگان درختی فارسی در چارچوب دستور ساخت سازهای هستهبنیان (HPSG) مجموعهای است شامل بیش از ۱۰۰۰ جمله برچسبخورده با اطلاعات نحوی. ازجمله ویژگیهای دستور ساخت سازهای هستهبنیان این است که علاوه بر ارائه توصیف ساختاری سلسله مراتبی سازهها، دانش واژگانی واژهها مورد استفاده قرار میگیرد، و ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی میزان
کد داده: D3920221a | ثبت در مرجع: ۲۲ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۳۱۲۱ پیکره میزان مجموعهای است حاوی بیش از ۱ میلیون جمله از متون انگلیسی (اغلب در حوزه ادبیات کلاسیک) و ترجمه این جملات به فارسی که توسط دبیرخانه شورای عالی اطلاعرسانی تهیه شده است. از این پیکره میتوان در کاربردهای مختلف پردازش زبان طبیعی و به ویژه در ... ادامه مطلب »
پیکره – فارسدات تلفنی
کد داده: D3920124c | ثبت در مرجع: ۲۵ فروردین ۱۳۹۲ | تعداد بازدید: ۱۴۳۹ دادگان فارسدات تلفنی (TFarsDat)، مجموعهای از عبارات و جملات است که توسط گویندگان فارسیزبان از مناطق مختلف کشور از طریق خط تلفن بیان شده است. این دادگان در سطح واج (آوا) با دقت میلیثانیه تقطیع و برچسبدهی شده و بصورت فایلهای مجزا ذخیره گردیده است. تهیه این ... ادامه مطلب »
پیکره – فارسدات
کد داده: D3920124a | ثبت در مرجع: ۲۵ فروردین ۱۳۹۲ | تعداد بازدید: ۲۲۰۷ دادگان فارسدات (FarsDat)، مجموعهای از عبارات و جملات است که توسط گویندگان فارسیزبان از مناطق مختلف کشور بیان شده است. این دادگان در سطح واج (آوا) با دقت میلیثانیه تقطیع و برچسبدهی شده و بصورت فایلهای مجزا ذخیره گردیده است. این دادگان، به عنوان دادگان استاندارد ... ادامه مطلب »
پیکره – مجموعه همشهری (نسخه ۲)
کد داده: D3920117a | ثبت در مرجع: ۲۰ فروردین ۱۳۹۲ | تعداد بازدید: ۲۰۶۹ مجموعه همشهری پیکرهای است حاوی ۳۱۸ هزار سند مربوط به اخبار سالهای ۱۳۷۵ تا ۱۳۸۶ که با خزش (Crawl) وبسایت همشهری و چندین مرحله پیشپردازش و برچسبگذاری حاصل آمده است. همه اسناد مجموعه همشهری دارای برچسب «Cat» هستند که نشان میدهد هر سند در چه ردهای ... ادامه مطلب »
پیکره – فرهنگ ظرفیت نحوی افعال فارسی (نسخه ۳.۰)
کد داده: D3911212a | ثبت در مرجع: ۲۴ اسفند ۱۳۹۱ | تعداد بازدید: ۳۶۴۸ فرهنگ ظرفیت نحوی افعال فارسی مجموعهای است حاوی اطلاعات مربوط به ظرفیت نحوی بیش از ۴۵۰۰ فعل در زبان فارسی. در این فرهنگ، متممهای اجباری و اختیاری انواع فعلهای ساده، مرکب، پیشوندی و عبارات فعلی مشخص شده است. فراوانی فعلهای مرکب در زبان فارسی، نیاز به ... ادامه مطلب »
پیکره – دادگان صوتی هجاهای فارسی
کد داده: D3911203a | ثبت در مرجع: ۰۵ اسفند ۱۳۹۱ | تعداد بازدید: ۱۸۹۰ دادگان گفتاری حاضر شامل حدود ۵۸۰۰ فایل صوتی هجاهای زبان فارسی است که توسط پژوهشکده پردازش هوشمند علائم برای یک برنامه بازسازی گفتار فارسی از نوع بازسازی گفتار به شیوه همگذاری طراحی شده است. بخش اعظم هجاها از صورت واجنویسیشده دادگان بزرگ زبان فارسی گفتاری «فارسدات بزرگ» ... ادامه مطلب »