Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

텍스트 검출 및 인식

영상 특징 검출 및 설명, 딥러닝, OCR을 사용하여 텍스트 검출 및 인식

영상에서 텍스트를 검출하고 인식하는 일은 컴퓨터 비전 응용 분야에서 일반적으로 수행되는 작업입니다. 예를 들어, 이동하는 차량에서 도로 장면의 비디오를 캡처하고 캡처된 장면에서 표지판을 인식한 후 표지판 정보를 운전자에게 알릴 수 있습니다. 이 툴박스는 여러 언어로 된 텍스트를 검출하고 인식할 수 있는 함수를 제공합니다.

텍스트 인식의 첫 단계는 영상에서 텍스트 영역을 검출하고 분할하는 것입니다. 텍스트 영역을 검출하려면 국소 영상 특징 검출기와 설명자를 사용하거나 복잡한 영상 장면에서 텍스트를 검출하도록 사전 훈련된 딥러닝 모델을 사용하십시오. 이 툴박스의 예제에서는 텍스트 검출에 블롭 분석, MSER(maximally stable extremal regions) 특징 검출기 및 CRAFT(character region awareness for text detection) 딥러닝 모델을 사용하는 방법을 보여줍니다.

  • 블롭 분석은 테스트 영상이 전경에 텍스트 영역이 있는 이진화된 영상일 경우 잘 동작합니다. 이 방법은 영역 통계량을 사용하여 영상 전경에서 효과적으로 텍스트를 국소화하고 추출합니다. 영상 이진화 같은 분할 방법을 사용하여 영상을 이진화합니다.

  • MSER 특징 검출기는 영상에서 텍스트 영역의 기하학적 특성을 미리 알고 있을 경우 잘 동작합니다. 또한, 영상의 텍스트 영역이 균일한 명암 또는 색 값을 갖는 고대비 영역이어야 합니다. 이 특징 검출기는 기하 제약 조건을 사용하여 텍스트가 아닌 영역을 필터링하고, 균일한 배경과 복잡한 배경을 모두 갖는 영상에서 텍스트 영역을 검출합니다.

  • CRAFT 모델은 영상 배경, 대비, 명암 값과 같은 요인에 관계없이 영상에서 텍스트 영역을 검출할 수 있는 견고한 접근 방식입니다. 영상에서 텍스트 영역을 분할하는 것이 어려울 경우 CRAFT 모델을 사용하십시오. 이 모델에는 다른 텍스트 검출 방식보다 더 많은 계산 리소스가 필요합니다.

텍스트 검출 정확도를 높이기 위해 텍스트 분할을 전처리 또는 후처리 단계로 수행할 수 있습니다. 영상 영역으로부터 텍스트를 분할하려면 영상 이진화 및 군집화와 같은 영상 분할 기법을 사용하십시오. 영상 분할을 위한 MATLAB® 함수에 대한 자세한 내용은 영상 분할 항목을 참조하십시오. 또는 색 이진화영상 분할기 앱을 사용하여 영상에서 원하는 텍스트 영역을 대화형 방식으로 분할할 수 있습니다.

다음 단계는 머신러닝(ML) 기반의 분류 방법 또는 광학 문자 인식(OCR) 방법을 사용하여 검출 또는 분할된 영역에서 텍스트를 인식하는 것입니다. ocr 함수는 OCR 엔진 페이지인 Tesseract Open Source OCR Engine에서 제공하는 OCR Language Data 지원 파일을 사용합니다. 지원 파일에는 여러 언어로 된 문자를 인식하도록 사전 훈련된 언어 데이터 파일이 포함되어 있습니다. visionSupportPackages 함수 또는 애드온 탐색기를 사용하여 추가 언어 파일을 다운로드할 수 있습니다. 애드온을 다운로드하는 방법에 대한 자세한 내용은 애드온을 받고 관리하기 항목을 참조하십시오. Tesseract Open Source OCR Engine의 OCR Language Data 지원 파일을 설치 및 사용하는 방법에 대한 절차를 보려면 Install OCR Language Data Files 항목을 참조하십시오.

OCR 훈련기특정 문자 집합을 인식하도록 광학 문자 인식 모델 훈련

함수

모두 확장

vision.BlobAnalysisProperties of connected regions
detectMSERFeaturesDetect MSER features and return MSERRegions object
detectTextCRAFTDetect texts in images by using CRAFT deep learning model
extractHOGFeaturesExtract histogram of oriented gradients (HOG) features
ocrRecognize text using optical character recognition
ocrTextObject for storing OCR results
visionSupportPackagesStart installer to download, install, or uninstall Computer Vision Toolbox data

도움말 항목

시작하기

광학 문자 인식 사용