객체 검출 및 분할
Computer Vision Toolbox™는 AI 모델을 사용한 객체 검출, 텍스트 검출(OCR), 분할의 전체 워크플로를 지원합니다. 영상 레이블 지정기 앱과 비디오 레이블 지정기 앱에서 대화형 및 AI 지원 방식으로 영상과 비디오에 레이블을 지정하여 ground truth 데이터를 만드는 것부터 시작할 수 있습니다. 객체 검출의 경우, Computer Vision Toolbox는 YOLO, RTMDet, SSD, Grounding DINO와 같은 사전 훈련된 딥러닝 모델을 제공하며, 이러한 모델을 바로 사용하거나 전이 학습을 통해 자신의 응용 사례에 맞게 미세 조정할 수 있습니다. 또한 객체 검출기 분석기 앱을 사용하여 객체 검출 성능 메트릭을 평가할 수 있습니다. 객체 검출에 대한 자세한 내용은 Get Started with Object Detection Using Deep Learning 항목을 참조하십시오.
의미론적 분할의 경우, U-Net, DeepLab v3+, BiseNet v2, 3-D U-Net과 같은 사전 훈련된 딥러닝 모델을 사용할 수 있습니다. 의미론적 분할에 대한 자세한 내용은 딥러닝을 사용한 의미론적 분할 시작하기 항목을 참조하십시오. 인스턴스 분할의 경우, SOLOv2, Mask R-CNN과 같은 사전 훈련된 딥러닝 모델을 사용할 수 있습니다. 인스턴스 분할에 대한 자세한 내용은 Get Started with Instance Segmentation Using Deep Learning 항목을 참조하십시오.
텍스트 검출의 경우, MSER 특징 검출기 또는 CRAFT 딥러닝 모델을 사용한 다음, 검출된 텍스트를 OCR을 사용하여 인식할 수 있습니다. 자세한 내용은 Getting Started with OCR 항목을 참조하십시오. Computer Vision Toolbox는 사람의 자세 추정을 위한 사전 훈련된 HRNet 키포인트 검출기도 제공하며, 이를 다른 객체에 대한 사용자 지정 키포인트 검출을 위해 미세 조정할 수도 있습니다. 자세한 내용은 Getting Started with HRNet 항목을 참조하십시오.
카테고리
- 객체 검출
ground truth에 레이블 지정, YOLO 및 Grounding DINO와 같은 사전 훈련된 AI 모델을 사용하여 객체 검출, 전이 학습을 사용하여 사용자 지정 검출기 생성
- 의미론적 분할
ground truth에 레이블 지정, 사전 훈련된 AI 모델을 사용하여 의미론적 분할 수행, 전이 학습을 통해 U-Net과 같은 사용자 지정 신경망 훈련
- 인스턴스 분할
ground truth에 레이블 지정, SOLOv2, Mask R-CNN, SAM과 같은 사전 훈련된 AI 모델을 사용하여 인스턴스 분할 수행, 전이 학습을 통해 사용자 지정 신경망 훈련
- 텍스트, 바코드, 기준 마커(fiducial marker) 검출 및 인식
AI 모델을 사용한 텍스트(OCR), 바코드, 기준 마커(fiducial marker) 검출 및 인식
- 키포인트 검출
사전 훈련된 HRNet 키포인트 검출기를 사용하여 영상에서 사람 자세 추정 또는 사용자 지정 객체 키포인트 검출기 훈련
- 자동 외관 검사
이상 탐지 및 위치추정 방법을 사용하여 품질 제어 작업 자동화







