پایگاه دادههای زبان فارسی مجموعهای است از متون مختلف فارسی که بخشی از آن دارای نشانهگذاریهایی از جمله شناسنامه متن، برچسبهای دستوری، آوایی، ریشهای و معنایی است. این دادگان که در پژوهشگاه علوم انسانی و مطالعات فرهنگی تهیه شده است مجهز به نرمافزارهای اختصاصی جستجو، تقطیع و تحلیل متن است که میتواند انواع فهرستهای واژگانی، بسامدی و آماری را ارائه کند. از جمله متون موجود در پیکره حدود ۴۵۰ اثر داستانی و غیر داستانی نثر، ۲۵۰ اثر شعری از شاعران معاصر، بیش از ۸۰ عنوان مجله و نشریه علمی ادبی و تخصصی، نزدیک به ۳۰۰ عنوان نمایشنامه و فیلمنامه، و ۲۰۰ عنوان ادبیات کودک، چندین عنوان روزنامه و نشریه خبری، برخی از کتابهای درسی دانشگاهی و دبیرستانی، برخی از کتابهای دبستانی، نامههای اداری و بخشنامهها، مجموعه کامل قوانین و مقررات، نشریهها و جزوههای پراکنده، پوسترها، دیوارنوشتهها است.
پژوهشگاه علوم انسانی و مطالعات فرهنگی
این داده به صورت رسمی منتشر نشده است. نسخه برخط نرمافزار جستجو در داده موجود است.
– مصطفی عاصی. (۱۳۸۴). پایگاه دادههای زبان فارسی در اینترنت. پژوهشگران، (۲). (دریافت)
– Assi, S. M. (1997). Farsi linguistic database (FLDB). International Journal of Lexicography, 10(3), 5.
زبانشناسی پیکرهای
غیر فعال