پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران (UTPECC) از دو مجموعه اخبار متفاوت از دو مبدأ مجزا یعنی اخبار فارسی خبرگزاری همشهری و اخبار انگلیسی خبرگزاری بیبیسی ساخته شده است. همچنین برای همترازی اسناد این دو زبان، علاوه بر تاریخ انتشار اخبار، شباهت محتوای اسناد نیز در نظر گرفته شده است. این پیکره در آزمایشگاه پژوهشی سیستمهای هوشمند اطلاعات دانشگاه تهران تهیه شده است.
–
–
– Homa B. Hashemi, Azadeh Shakery, and Heshaam Faili, “Creating a Persian-English Comparable Corpus“, in proceedings of Conference on Multilingual and Multimodal Information Access Evaluation (CLEF), Padua, Italy, pp. 27-39, 2010.
– هما برادران هاشمی. (۱۳۸۹). استفاده از پیکرههای تطبیقی برای بازیابی اطلاعات بین زبانی فارسی-انگلیسی. پایاننامه کارشناسی ارشد. دانشگاه تهران.
– http://scholar.google.com/scholar?q=related:9WyTfSUyNjwJ:scholar.google.com/&hl=en&as_sdt=0,5
* اگر در پژوهش خود از این داده استفاده کردهاید و یا پژوهش دیگری را میشناسید که از این داده استفاده نموده باشد، لطفاً اطلاعات مربوط به پژوهش را برای ما ارسال فرمایید تا به این لیست اضافه شود.
بازیابی اطلاعات بین زبانی، ترجمه ماشینی، پردازش زبان طبیعی، زبانشناسی رایانشی، زبانشناسی پیکرهای
–