مجموعه ارقام دستنویس هدی مجموعه بزرگی از ارقام دستنویس فارسی است که مشتمل بر ۱۰۲۳۵۳ نمونه دستنوشته سیاه سفید میباشد. این مجموعه طی انجام یک پروژه کارشناسی ارشد در دانشگاه تربیت مدرس برای بازشناسی فرمهای دستنویس تهیه شده است. دادههای این مجموعه از حدود ۱۲۰۰۰ فرم ثبت نام آزمون سراسری کارشناسی ارشد سال ۱۳۸۴ و آزمون کاردانی پیوسته دانشگاه جامع علمی کاربردی سال ۱۳۸۳ استخراج شده است. فرمهای مورد پردازش در این پروژه از طریق شرکت هوش مصنوعی هدی سیستم تهیه شده است.
–
این مجموعه داده تنها برای استفاده تحقیقاتی رایگان بوده و استفاده تجاری از آن منوط به کسب اجازه از صاحب اثر است.
– Hossein Khosravi, & Ehsanollah Kabir. (2007). Introducing a Very Large Dataset of Handwritten Farsi Digits and a Study on their Varieties. Pattern Recognition Letters, 28(10), 1133–1141. (دریافت)
بازشناسی متون دستنویس
– معرفی مجموعه : http://farsiocr.ir
– برای خواندن مجموعه داده که در قالب فایلی با پسوند cdb. است کدهای C++ ،Matlab و یا دلفی آن را دریافت کنید.