به دلیل روند رو به گسترش تولید و استفاده از سیستمهای مبتنی بر نویسهخوانی نوری (OCR)، اهمیت وجود بانکهای اطلاعات تصاویر نوشتار فارسی بیش از پیش احساس میشود. این بانکهای اطلاعاتی هم به منظور توسعه و آموزش الگوریتمهای آموزشپذیر و هم به منظور ارزیابی سیستمهای ساخته شده، استفاده میشوند. متن دستنویس گسسته همان نوشتههایی است که حروف آن جدا از هم و به صورت گسسته نوشته شدهاند، مثل نام و نامخانوادگی که در فرمهای آزمون ثبتنام به صورت هر حرف داخل یک کادر نوشته میشوند. بانک اطلاعاتی حروف گسسته دستنویس مشتمل بر ۱۰ میلیون و ۲۳۶ هزار و ۴۰ نمونه تصویر است که حجم کل آن حدود ۱۲۰ گیگابایت میباشد. تصاویر موجود در این بانک در قالب BMP، با وضوح تصویر ۳۰۰ نقطه در اینچ و بهصورت خاکستری ۲۵۶ سطحی عرضه شدهاند.
دبیرخانه شورای عالی اطلاعرسانی
–
– Khosravi, S.; Razzazi, F.; Rezaei, H.; Sadigh, M.R., “A comprehensive handwritten image corpus of isolated persian/arabic characters for OCR development and evaluation,” Signal Processing and Its Applications, 2007. ISSPA 2007. 9th International Symposium on , vol., no., pp.1,4, 12-15 Feb. 2007 (دریافت)
– http://scholar.google.com/scholar?q=related:vNSZycB84asJ:scholar.google.com/&hl=en&as_sdt=0,5
* اگر در پژوهش خود از این داده استفاده کردهاید و یا پژوهش دیگری را میشناسید که از این داده استفاده نموده باشد، لطفاً اطلاعات مربوط به پژوهش را برای ما ارسال فرمایید تا به این لیست اضافه شود.