객체 검출 및 분할

AI 모델을 사용한 객체 검출, 텍스트 인식(OCR), 바코드 인식, 기준 마커(fiducial marker) 인식, 의미론적 분할과 인스턴스 분할 수행

Computer Vision Toolbox™는 AI 모델을 사용한 객체 검출, 텍스트 검출(OCR), 분할의 전체 워크플로를 지원합니다. 영상 레이블 지정기 앱과 비디오 레이블 지정기 앱에서 대화형 및 AI 지원 방식으로 영상과 비디오에 레이블을 지정하여 ground truth 데이터를 만드는 것부터 시작할 수 있습니다. 객체 검출의 경우, Computer Vision Toolbox는 YOLO, RTMDet, SSD, Grounding DINO와 같은 사전 훈련된 딥러닝 모델을 제공하며, 이러한 모델을 바로 사용하거나 전이 학습을 통해 자신의 응용 사례에 맞게 미세 조정할 수 있습니다. 또한 객체 검출기 분석기 앱을 사용하여 객체 검출 성능 메트릭을 평가할 수 있습니다. 객체 검출에 대한 자세한 내용은 Get Started with Object Detection Using Deep Learning 항목을 참조하십시오.

의미론적 분할의 경우, U-Net, DeepLab v3+, BiseNet v2, 3-D U-Net과 같은 사전 훈련된 딥러닝 모델을 사용할 수 있습니다. 의미론적 분할에 대한 자세한 내용은 딥러닝을 사용한 의미론적 분할 시작하기 항목을 참조하십시오. 인스턴스 분할의 경우, SOLOv2, Mask R-CNN과 같은 사전 훈련된 딥러닝 모델을 사용할 수 있습니다. 인스턴스 분할에 대한 자세한 내용은 Get Started with Instance Segmentation Using Deep Learning 항목을 참조하십시오.

텍스트 검출의 경우, MSER 특징 검출기 또는 CRAFT 딥러닝 모델을 사용한 다음, 검출된 텍스트를 OCR을 사용하여 인식할 수 있습니다. 자세한 내용은 Getting Started with OCR 항목을 참조하십시오. Computer Vision Toolbox는 사람의 자세 추정을 위한 사전 훈련된 HRNet 키포인트 검출기도 제공하며, 이를 다른 객체에 대한 사용자 지정 키포인트 검출을 위해 미세 조정할 수도 있습니다. 자세한 내용은 Getting Started with HRNet 항목을 참조하십시오.