تشخیص کاراکتر نوری رایگان برای زبان فارسی







05/09/1401

لطفا این صفحه را نشانه گذاری کنید.



تشخیص نویسه نوری (OCR) تبدیل الکترونیکی یا مکانیکی تصاویر متن تایپ شده، دست نویس یا چاپ شده به متن کدگذاری شده ماشینی است، خواه از یک سند اسکن شده، یک عکس از یک سند، یک عکس صحنه (به عنوان مثال، متن روی علائم و بیلبوردهای تبلیغاتی در یک منظره عکس)، یا از متن زیرنویس قرار داده شده بر روی یک تصویر (به عنوان مثال: از یک پخش تلویزیونی).

به طور گسترده ای برای وارد کردن داده ها از سوابق کاغذی چاپ شده - اعم از گذرنامه، صورتحساب، صورتحساب بانکی، رسید رایانه ای، کارت ویزیت، پست، پرینت داده های ثابت، یا هر سند مناسب دیگری استفاده می شود - این یک روش رایج برای دیجیتالی کردن متون چاپی است تا بتوانند به صورت الکترونیکی ویرایش شود، جستجو شود، فشرده‌تر ذخیره شود، به صورت آنلاین نمایش داده شود، و در فرآیندهای ماشینی مانند محاسبات شناختی، ترجمه ماشینی، و (استخراج) متن به sp OCR مورد استفاده قرار گیرد، زیرشاخه‌ای از مطالعه تشخیص الگو است که شامل هوش مصنوعی و بینایی کامپیوتر.

نسخه‌های قبلی نیاز به آموزش با عکس‌های شخصیت‌های فردی داشتند و هر بار روی یک تایپ فیس کار می‌کردند. سیستم های پیشرفته ای که قادر به ارائه درجه بالایی از دقت شناسایی برای اکثر حروف چاپی هستند، اکنون به طور گسترده در دسترس هستند، همانطور که سیستم هایی که تعدادی فرمت فایل تصویر دیجیتال را به عنوان ورودی می پذیرند، در حال حاضر به طور گسترده در دسترس هستند. سیستم‌های خاصی می‌توانند خروجی‌های قالب‌بندی‌شده را که تا حد امکان شبیه به صفحه اصلی است، از جمله گرافیک، ستون‌ها و سایر اجزای غیر متنی تکرار کنند.