کد داده: D3930518a | ثبت در مرجع: ۱۸ مرداد ۱۳۹۳ | تعداد بازدید: ۵۱۲۷ دسترسی به ابزار پژوهش رواسازی شده برای ارزیابی نوای گفتار (پروسودی) از ملزومات مطالعه گفتار احساسی (عاطفی) است. “پایگاه داده گفتار احساسی زبان فارسی Persian ESD”، اولین مجموعه جامع و معتبر گفتار احساسی برای زبان فارسی است که در دانشگاه Freie Universitaet Berlin ساخته و سپس ... ادامه مطلب »
نتیجه جستجو برای : Text
پیکره – دادگان تلفنی اعداد متصل
کد داده: D3930414a | ثبت در مرجع: ۱۵ تیر ۱۳۹۳ | تعداد بازدید: ۲۱۸۸ دادگان تلفنی اعداد متصل زبان فارسی شامل دادههای ضبطشده تلفنی از اعداد فارسی به صورت متصل است و مشتمل بر ۱۱۰ گوینده میباشد كه هر یك تقریبا ۷۰ رشته عددی را بیان كردهاند. هر رشته عددی جداگانه بر چسبدهی شده است. آزمایشهای متنوعی كه به وسیله ... ادامه مطلب »
پیکره مجموعه افعال تصریفشده فارسی
کد داده: D3930317a | ثبت در مرجع: ۱۸ خرداد ۱۳۹۳ | تعداد بازدید: ۲۵۴۳ دادگان «مجموعه افعال تصریفشده فارسی» مجموعهایست که به گردآوری مصادر مختلف فارسی در پیکرههای بیجنخان، همشهری، تبکورپ و چند منبع دیگر پرداخته است. این مصادر در صیغههای مختلف صرف شدهاند و ویژگیهای مختلف آنها از جمله بن ماضی، بن مضارع، زمان، شخص، شمار، نمود و … ... ادامه مطلب »
پیکره فارسی ۱۹۸۴
کد داده: D3930213a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۳ | تعداد بازدید: ۲۶۴۰ برای تهیه پیکره فارسی ۱۹۸۴ که در در چارچوب MULTEXT-East تولید شده است، رمان ۱۹۸۴ جرج اورول به عنوان متن اصلی انتخاب شده و نسخه فارسی این کتاب برای اضافه کردن زبان فارسی به این چارچوب حاشیهنویسی شده است. این پیکره که از ۱۱۰۰۰۰ توکن، ۱۱۲۶۶ ... ادامه مطلب »
دادگان گفتار لهجهدار سهند [منتشر نشده]
کد داده: D3930116a | ثبت در مرجع: ۱۶ فروردین ۱۳۹۳ | تعداد بازدید: ۲۰۹۸ دادگان گفتار لهجهدار سهند مجموعهای است شامل گفتار ضبطشده با ۵ لهجه مختلف که جهت پژوهش در حوزه پردازش گفتار و به ویژه در تشخیص لهجه در گفتار به کار میرود. برای تهیه این مجموعه که در دانشگاه صنعتی سهند تولید شده است، گفتار ۴۰ نفر ... ادامه مطلب »
پیکره دادگان گفتار احساسی سهند [منتشر نشده]
کد داده: D3921217a | ثبت در مرجع: ۱۸ اسفند ۱۳۹۲ | تعداد بازدید: ۲۰۷۴ دادگان گفتار احساسی سهند مجموعهای است شامل گفتار ضبطشده در ۵ حالت احساسی مختلف که جهت پژوهش در حوزه پردازش گفتار و به ویژه در تشخیص حالت احساسی در گفتار به کار میرود. برای تهیه این مجموعه که در دانشگاه صنعتی سهند تولید شده است، گفتار ... ادامه مطلب »
پیکره – پرسیکا (پیکره متون خبری)
کد داده: D3921115a | ثبت در مرجع: ۱۶ بهمن ۱۳۹۲ | تعداد بازدید: ۳۳۱۷ پرسیکا پیکرهای است حاوی متون خبری برگرفته از خبرگزاری ایسنا. متون این پیکره در یازده طبقه موضوعی شامل ورزشی، اقتصادی، فرهنگی، مذهبی، تاریخی، سیاسی، علمی، اجتماعی، آموزشی، حقوق قضایی، بهداشت طبقهبندی شدهاند و پیشپردازشهایی به منظور قابل استفاده بودن در کاربردهای مختلف پردازش زبان طبیعی و ... ادامه مطلب »
پیکره – پایگاه دادههای زبان فارسی [منتشر نشده]
کد داده: D3921014a | ثبت در مرجع: ۱۴ دی ۱۳۹۲ | تعداد بازدید: ۲۴۹۵ پایگاه دادههای زبان فارسی مجموعهای است از متون مختلف فارسی که بخشی از آن دارای نشانهگذاریهایی از جمله شناسنامه متن، برچسبهای دستوری، آوایی، ریشهای و معنایی است. این دادگان که در پژوهشگاه علوم انسانی و مطالعات فرهنگی تهیه شده است مجهز به نرمافزارهای اختصاصی جستجو، تقطیع ... ادامه مطلب »
پیکره بیجنخان
کد داده: D3920916a | ثبت در مرجع: ۱۶ آذر ۱۳۹۲ | تعداد بازدید: ۲۳۷۴ پیکره بیجنخانی مجموعهای است از متون فارسی شامل بیش از ۲میلیون و ۶۰۰هزار کلمه که با ۵۵۰ نوع برچسب POS برچسبگذاری شدهاند. این پیکره که در پژوهشکده پردازش هوشمند علائم تهیه شده است همچنین شامل بیش از ۴۳۰۰ تگ موضوعی چون سیاسی، تاریخی و … برای ... ادامه مطلب »
پیکره نور [منتشر نشده]
کد داده: D3920811a | ثبت در مرجع: ۱۱ آبان ۱۳۹۲ | تعداد بازدید: ۱۷۳۵ پیکره نور مجموعهای است عظیم از متون اسلامی که عمدتاً به زبان عربی و فارسی نوشته شدهاند. متون مربوط به بیش از ۴ هزار کتاب عربی (بیش از یک میلیارد کلمه) و بیش از ۲ هزار کتاب فارسی (بیش از ۶۰۰ میلیون کلمه) و همچنین بالغ ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی پیام
کد داده: D3920713a | ثبت در مرجع: ۱۴ مهر ۱۳۹۲ | تعداد بازدید: ۲۴۸۴ پیکره موازی انگلیسی-فارسی پیام مجموعهای است از جملات فارسی و انگلیسی که از مستندات دوزبانه وب استخراج شدهاند. در این پیکره که حاوی حدود صدهزار جمله موازی است، همترازی به شکل دستی و در سطح جمله انجام گرفته است. متون مورد استفاده در این پیکره موازی ... ادامه مطلب »
پیکره – دادگان دایفونی فارسی [منتشر نشده]
کد داده: D3920616a | ثبت در مرجع: ۱۶ شهریور ۱۳۹۲ | تعداد بازدید: ۱۸۷۲ واحد پایه مورد استفاده در دادگان صوتی برای بازسازی رایانهای گفتار باید به گونهای انتخاب شود كه اولاً حجم حافظه معقولی را اشغال كند، یعنی تعداد واحدهای آوایی مطلوب باشد و ثانیاً بتوان گذرهای آوایی را در دادگان پوشش داد. از جمله واحدهایی كه با هدف ... ادامه مطلب »
پیکره – واژگان نحوی و معنایی افعال مرکب فارسی (نسخه ۱.۰)
کد داده: D3920512a | ثبت در مرجع: ۱۲ مرداد ۱۳۹۲ | تعداد بازدید: ۲۴۴۳ واژگان نحوی و معنایی افعال مرکب فارسی (PersPred) مجموعهای است چندزبانه شامل اطلاعات نحوی و معنایی افعال مرکب زبان فارسی، ترجمه انگلیسی و فرانسوی افعال و حداقل یک جمله مثال برای هر فعل. اطلاعات نحوی بر اساس دیدگاه گروس و اطلاعات معنایی بر اساس دیدگاه لوین ... ادامه مطلب »
پیکره دوزبانه فارسی-انگلیسی امیرکبیر [منتشر نشده]
کد داده: D3920418a | ثبت در مرجع: ۲۶ تیر ۱۳۹۲ | تعداد بازدید: ۱۶۵۶ پیکره دوزبانه فارسی-انگلیسی امیرکبیر (AFEC) پیکرهای موازی از جملات فارسی و انگلیسی است که در آزمایشگاه فناوری زبان انسانی دانشگاه صنعتی امیرکبیر و با حمایت پژوهشگاه فضای مجازی به عنوان یکی از خروجیهای پروژه ترجمه ماشینی تهیه شده است. برای تهیهٔ این مجموعه که حاوی حدود ۱۵میلیون ... ادامه مطلب »
پیکره – مجموعه ارقام دستنویس هدی
کد داده: D3920411a | ثبت در مرجع: ۱۷ تیر ۱۳۹۲ | تعداد بازدید: ۱۹۸۲ مجموعه ارقام دستنویس هدی مجموعه بزرگی از ارقام دستنویس فارسی است که مشتمل بر ۱۰۲۳۵۳ نمونه دستنوشته سیاه سفید میباشد. این مجموعه طی انجام یک پروژه کارشناسی ارشد در دانشگاه تربیت مدرس برای بازشناسی فرمهای دستنویس تهیه شده است. دادههای این مجموعه از حدود ۱۲۰۰۰ فرم ثبت ... ادامه مطلب »
پیکره درختی وابستگی فارسی اوپسالا
کد داده: D3920404a | ثبت در مرجع: ۱۰ تیر ۱۳۹۲ | تعداد بازدید: ۱۹۸۲ پیکره درختی وابستگی فارسی اوپسالا (UPDT) مجموعهای است از جملات فارسی که در آن روابط نحوی کلمات بر مبنای دستور وابستگی مشخص شده است. این پیکره که در دانشگاه اوپسالای سوئد تهیه شده است، حاوی ۶.۰۰۰ جمله برگفته از پیکره فارسی اوپسالا (UPC – نسخهای تغییریافته ... ادامه مطلب »