واحد پایه مورد استفاده در دادگان صوتی برای بازسازی رایانهای گفتار باید به گونهای انتخاب شود كه اولاً حجم حافظه معقولی را اشغال كند، یعنی تعداد واحدهای آوایی مطلوب باشد و ثانیاً بتوان گذرهای آوایی را در دادگان پوشش داد. از جمله واحدهایی كه با هدف تأمین این شرایط، تعریف و مورد استفاده قرار میگیرد، دایفون است. دایفون عبارت است از نیمه پایدار یك آوا تا نیمه پایدار آوای بعدی. دایفون از دو نیمآوای به هم چسبیده تشكیل میشود، البته باید درنظر داشت كه این تركیب شامل تركیب سكوت و نیمآوا نیز میباشد. با این تعریف انواع دایفونهای زبان فارسی شامل توالیهای cc، cv، vc، -c، c- ، v- و -v است، كه “-” به معنای سكوت میباشد. در دادگان دایفونی فارسی که در پژوهشکده پردازش هوشمند علائم تهیه شده است، تعداد ۹۶۶ دايفون وجود دارد.
پژوهشکده پردازش هوشمند علائم
این داده به صورت رسمی منتشر نشده است. در صورت انتشار اطلاعرسانی خواهد شد.
– محرم اسلامی، جواد شیخزادگان، زهرا احمدینیا، و علی بهرامی راد. (۱۳۸۸). مراحل و نحوه تهیه دادگانهای صوتی هجایی و دایفونی برای سامانه تبدیل متن به گفتار فارسی. دوفصلنامه علمی-پژوهشی پردازش علائم و دادهها، (۱۲)، ۳–۱۲. (دریافت)
پردازش گفتار، پردازش زبان طبیعی، زبانشناسی رایانشی
غیرفعال