پیکره موازی انگلیسی فارسی تهران (TEP) مجموعهای است حاوی بیش از ششصدهزار جمله همترازشده انگلیسی و فارسی که از زیرنویس ۱۶۰۰ فیلم استخراج شدهاند. این پیکره در آزمایشگاه پردازش زبان طبیعی دانشگاه تهران تهیه شده است و در ماشینهای ترجمه و دیگر سیستمهای پردازش زبان طبیعی کاربرد دارد.
–
–
– Mohammad Taher Pilevar, Heshaam Faili, and Abdol Hamid Pilevar. 2011. TEP: Tehran English-Persian parallel corpus. In Proceedings of the 12th international conference on Computational linguistics and intelligent text processing (CICLing’11), pages 68-79, Tokyo, Japan. (دریافت)
– http://scholar.google.com/scholar?q=related:SpnIij3ObP8J:scholar.google.com/&hl=en&as_sdt=0,5
* اگر در پژوهش خود از این داده استفاده کردهاید و یا پژوهش دیگری را میشناسید که از این داده استفاده نموده باشد، لطفاً اطلاعات مربوط به پژوهش را برای ما ارسال فرمایید تا به این لیست اضافه شود.
ترجمه ماشینی، پردازش زبان طبیعی، زبانشناسی رایانشی، زبانشناسی پیکرهای