فناوری او-سی-آر چیست؟

فرض کنید که شما دانشجوی کارشناسی ارشد هستید و درمورد موضوع پایان نامه ی شما مطلب زیادی روی اینترنت وجود ندارد ، پس ناچارید که به کتاب های فیزیکی مراجعه کنید. بعد مدتها جستجو مطالب خیلی خوبی هم پیدا میکنید اما حالا باید حجم زیادی مطلب رو تایپ کنید درحالیکه تا روز دفاع، وقتی زیادی نمونده. اینجاست که فناوری OCR به کمکتون میاد.

OCR چیست؟

تا به امروز با کمک دستگاه های اسکنر، کتاب های فیزیکی به نسخه ی دیجیتال تبدیل میشدند.اما مشکل این نسخه ها این هست که قابلیت کپی کردن و یا جستجوی متن در اونها وجود نداره.کاری که فناوری OCR ( او سی آر که مخفف عبارت Optical Character Recognition) انجام میده، پردازش تصویر یک متن و استخراج متن موجود هست.

OCR فارسی به چه صورت هست؟

او سی آر فارسی (Persian OCR) با کمی پیچیدگی روبرو هست که به علت پیچیدگی های رسم الخط فارسی هست . مثلا حروف شبیه به هم زیادی داریم مثل ح و خ که تفاوتشون در حد یک نقطه هست و به سادگی باهم اشتباه گرفته میشوند. البته هرچه کیفیت فایل اسکن شده بیشتر و تصویر کاملا واضح و بدون سایه باشه ،نتیجه ی نهایی پس از تبدیل، بهتر میشه.

برای تبدیل تصویر به متن کلیک کنید