한국어 광학 문자 인식







2022-11-26

이 페이지를 북마크하세요.



광학 문자 인식(OCR) 스캔한 문서, 문서 사진, 장면 사진(예: 풍경의 간판 및 광고판에 있는 텍스트)에서 입력, 손으로 쓴 또는 인쇄된 텍스트의 이미지를 기계 인코딩된 텍스트로 전자적 또는 기계적으로 변환하는 것입니다. 사진) 또는 이미지에 겹쳐진 자막 텍스트(예: 텔레비전 방송).

여권, 송장, 은행 거래 명세서, 컴퓨터 영수증, 명함, 우편, 정적 데이터 인쇄물 또는 기타 적절한 문서 등 인쇄된 종이 기록의 데이터를 입력하는 데 널리 사용됩니다. 전자적으로 편집되고, 검색되고, 더 압축적으로 저장되고, 온라인으로 표시되고, 인지 컴퓨팅, 기계 번역 및 (추출된) text-to-sp와 같은 기계 프로세스에서 사용됩니다. OCR은 인공 지능 및 컴퓨터 비전.

이전 버전은 개별 캐릭터의 사진으로 교육을 받아야 했으며 한 번에 하나의 서체로 작업했습니다. 대부분의 서체에 대해 높은 수준의 식별 정확도를 제공할 수 있는 고급 시스템이 이제 널리 사용 가능하며 다양한 디지털 사진 파일 형식을 입력으로 허용합니다. 특정 시스템은 그래픽, 열 및 기타 텍스트가 아닌 구성 요소를 포함하여 가능한 원본 페이지와 유사한 형식의 출력을 복제할 수 있습니다.