پیکره وابستگی نحوی زبان فارسی مجموعهای است شامل حدود ۳۰ هزار جمله برچسبخورده با اطلاعات نحوی و ساختواژی. این پیکره میتواند به عنوان زیرساختی اساسی در پردازش رایانهای زبان فارسی به کار رود. مهمترین دلائل استفاده از دستور وابستگی در این پیکره نحوی عبارتند از: نتایج رضایتبخش در یادگیری خودکار و سازگاری مناسب با طبیعت زبانهای بیترتیب همچون زبان فارسی. در نسخه جدید پیکره وابستگی نحوی زبان فارسی (نسخه ۱.۱.۱) تغییراتی چون حذف جملات تکراری، یکسانسازی نویسهها، رفع برخی خطاهای برچسبزنی و تغییر نسبت دادههای آموزش، توسعه و آزمون اعمال شده است.
دبیرخانه شورای عالی اطلاعرسانی
– تنها برای مقاصد علمی و غیر تجاری
– Mohammad Sadegh Rasooli, Manouchehr Kouhestani, and Amirsaeid Moloodi. (2013). Development of a Persian Syntactic Dependency Treebank. In The 2013 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL HLT), Atlanta, USA. (دریافت)
– محمدصادق رسولی، منوچهر کوهستانی، و امیرسعید مولودی. (۱۳۹۳). پیکره نحوی زبان فارسی: پژوهشی بر اساس دستور وابستگی. تهران: دبیرخانهٔ شورای عالی اطلاعرسانی. (دریافت) ISBN/شابک:9789648846379
– گروه پژوهشی دادگان. (۱۳۹۱). گزارش پروژه دادگان وابستگی زبان فارسی. تهران: دبیرخانه شورای عالی اطلاعرسانی. (دریافت)
– Dadegan Research Group. (2012). Persian Dependency Treebank, Version 1.0, Annotation Manual and User Guide. Tehran, I.R. Iran: Supreme Council of Information and Communication Technology. (دریافت)
تجزیه نحوی، پردازش زبان طبیعی، زبانشناسی رایانشی، زبانشناسی پیکرهای
– http://dadegan.ir/catalog/perdt/about – صفحه معرفی پیکره وابستگی نحوی زبان فارسی (ویژگیها، نمونه، مستندات، اعضای پروژه، ابزار)
– http://search.dadegan.ir – سامانه جستجوی دادگان (جستجوی برخط در پیکره وابستگی نحوی زبان فارسی)