پیکره نور مجموعهای است عظیم از متون اسلامی که عمدتاً به زبان عربی و فارسی نوشته شدهاند. متون مربوط به بیش از ۴ هزار کتاب عربی (بیش از یک میلیارد کلمه) و بیش از ۲ هزار کتاب فارسی (بیش از ۶۰۰ میلیون کلمه) و همچنین بالغ بر ۲۰۰ کتاب دوزبانه (عربی-فارسی) توسط مرکز تحقیقات کامپیوتری علوم اسلامی (نور) در این پیکره جمعآوری شده است.
مرکز تحقیقات کامپیوتری علوم اسلامی (نور)
این داده به صورت رسمی منتشر نشده است. در صورت انتشار اطلاعرسانی خواهد شد.
– Elahimanesh, M. H., Minaei-Bidgoli, B., Gholami, M. J., & Juzi, H. (2012) An Introduction to Noor Corpus and its Language Model. in First International Conference on Persian Language Processing (ICPLP), Semnan, Iran. (دریافت)
–
مدلسازی زبانی، پردازش زبان طبیعی، زبانشناسی رایانشی، زبانشناسی پیکرهای
غیر فعال