دادگان درختی فارسی در چارچوب دستور ساخت سازهای هستهبنیان (HPSG) مجموعهای است شامل بیش از ۱۰۰۰ جمله برچسبخورده با اطلاعات نحوی. ازجمله ویژگیهای دستور ساخت سازهای هستهبنیان این است که علاوه بر ارائه توصیف ساختاری سلسله مراتبی سازهها، دانش واژگانی واژهها مورد استفاده قرار میگیرد، و روابط بین واژههای یک سازه به طور واضح و صریح مشخص میگردد.
–
– Ghayoomi, Masood (2012) “Bootstrapping the Development of an HPSG-based Treebank for Persian” In Linguistic Issues in Language Technology, 7 (1). CSLI Publications.
– مسعود قیومی. (۱۳۹۲). معرفی دادگان درختی و تجزیهگر خودکار فارسی. ارائه شده در هشتمین همایش زبانشناسی ایران، تهران، دانشگاه علامهطباطبایی.
– Ghayoomi, Masood (2012) “From Grammar Rule Extraction to Treebanking: A Bootstrapping Approach” In Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC’12), May 23-25, 2012; Istanbul, Turkey, pp: 1912-1919.
– Ghayoomi, Masood (2012) “Word clustering for Persian statistical parsing” In Advances in Natural Language Processing , LNAI 5221 of Springer, eds H. Isahara and K. Kanzaki, JapTAL’12: Proceedings of the 8th International Conference on Advances in Natural Language Processing, October 22-24, 2012; Kanazawa, Japan, pp: 126-137.
– Ghayoomi, Masood and Omid Moradiannasab (2012) “The effect of treebank annotation granularity on parsing: A comparative study” In Proceedings of the 11th International Workshop on Treebanks and Linguistic Theories , November 30 – December 1, 2012, Lisbon, Portugal, pp: 109-114.
– http://scholar.google.com/scholar?q=related:tVD1R4mpU2gJ:scholar.google.com/&hl=en&as_sdt=0,5
– Sarabi, Zahra and Morteza Analoui (2012) “A New DOP Model for Phrase-structure Parsing of Persian Sentences” In Proceedings of the 10th Workshop on Asian Language Resources, COLINg 2012, December 8-15, 2012; Mumbai, India, pp. 45-54.
تجزیه نحوی، پردازش زبان طبیعی، زبانشناسی رایانشی
– http://hpsg.fu-berlin.de/~ghayoomi/PTB.html
– DepPerTreeBank – تبدیل خودکار دادگان درختی فارسی در چارچوب دستور ساخت سازهای هستهبنیان به پیکره وابستگی بر اساس قالب CoNLL 2006 و CoNLL 2009.