پیکره بیجنخانی مجموعهای است از متون فارسی شامل بیش از ۲میلیون و ۶۰۰هزار کلمه که با ۵۵۰ نوع برچسب POS برچسبگذاری شدهاند. این پیکره که در پژوهشکده پردازش هوشمند علائم تهیه شده است همچنین شامل بیش از ۴۳۰۰ تگ موضوعی چون سیاسی، تاریخی و … برای متون است.
پژوهشکده پردازش هوشمند علائم
– بیجنخان، محمود. نقش پیکرههای زبانی در نوشتن دستور زبان: معرفی یک نرمافزار رایانهای. مجلهٔ زبانشناسی. سال نوزدهم. شمارهٔ دوم. صص ۴۸-۶۷. ۱۳۸۳.
– نسخه کامل پیکره بی جن خان با عنوان «پیکره متنی زبان فارسی»: http://dadegan.ir/catalog/matni
– نسخه تغیریافته پیکره بی جن خان در دانشگاه تهران: http://ece.ut.ac.ir/dbrg/bijankhan
– نسخه تغیریافته پیکره بی جن خان در دانشگاه اوپسالا: http://stp.lingfil.uu.se/~mojgan/UPC.html