التعرف البصري على الحروف للغة العربية







18/10/45 1

يرجى وضع إشارة مرجعية على هذه الصفحة.



التعرف البصري على الأحرف (OCR) هو التحويل الإلكتروني أو الميكانيكي لصور نص مكتوب أو مكتوب بخط اليد أو مطبوع إلى نص مشفر آليًا ، سواء من مستند ممسوح ضوئيًا أو صورة لمستند أو صورة مشهد (على سبيل المثال ، النص الموجود على اللافتات واللوحات الإعلانية في منظر طبيعي صورة فوتوغرافية) ، أو من نص عنوان فرعي متراكب على صورة (على سبيل المثال: من بث تلفزيوني).

تُستخدم على نطاق واسع لإدخال البيانات من السجلات الورقية المطبوعة - سواء جوازات السفر أو الفواتير أو كشوف الحسابات المصرفية أو الإيصالات المحوسبة أو بطاقات العمل أو البريد أو مطبوعات البيانات الثابتة أو أي وثائق أخرى مناسبة - إنها طريقة شائعة لرقمنة النصوص المطبوعة حتى يتمكنوا من ذلك أن يتم تحريرها إلكترونيًا والبحث عنها وتخزينها بشكل أكثر إحكاما وعرضها على الإنترنت واستخدامها في عمليات الآلة مثل الحوسبة المعرفية والترجمة الآلية و (المستخرجة) من النص إلى sp. رؤية الكمبيوتر.

تطلبت الإصدارات السابقة تدريبًا على صور شخصية فردية وعملت على محرف واحد في كل مرة. الأنظمة المتقدمة القادرة على تقديم درجة عالية من دقة التعرف على غالبية الخطوط متاحة الآن على نطاق واسع ، وكذلك الأنظمة التي تقبل عددًا من تنسيقات ملفات الصور الرقمية كمدخلات. بعض الأنظمة قادرة على نسخ المخرجات المنسقة المشابهة للصفحة الأصلية قدر الإمكان ، بما في ذلك الرسومات والأعمدة والمكونات الأخرى غير النصية.