주요 콘텐츠

객체 검출

ground truth에 레이블 지정, YOLO 및 Grounding DINO와 같은 사전 훈련된 AI 모델을 사용하여 객체 검출, 전이 학습을 사용하여 사용자 지정 검출기 생성

Computer Vision Toolbox™는 딥러닝과 전통적인 컴퓨터 비전 기법을 모두 사용하여 객체 검출 모델을 구축, 훈련, 평가 및 배포할 수 있는 포괄적인 툴과 함수를 제공합니다. 영상 레이블 지정기 앱과 비디오 레이블 지정기 앱을 사용하여 레이블이 지정된 ground truth를 만드는 것부터 시작할 수 있습니다. 이 두 앱은 대화형 및 AI 지원 방식으로 영상과 비디오 프레임에서 객체를 둘러싸는 경계 상자를 주석 처리하는 작업을 지원합니다.

데이터에 레이블을 지정한 후에는 YOLO v2, YOLO v3, YOLO v4, YOLOX, RTMDet, SSD, Grounding DINO 등 다양한 사전 훈련된 딥러닝 객체 검출기 중에서 선택할 수 있습니다. 이 툴박스에는 peopleDetectorfaceDetector와 같이 사람 인식 작업과 얼굴 인식 작업에 특화된 검출기도 포함되어 있습니다. 이러한 모델을 바로 추론에 사용하거나, 전이 학습의 시작점으로 사용하여 특정 데이터 세트와 응용 분야에 맞게 사용자 지정할 수 있습니다. 자세한 내용은 Get Started with Object Detection Using Deep Learning 항목을 참조하십시오. 고전적인 객체 검출 방법을 위해, 이 툴박스에는 ACF(Aggregate Channel Features)와 캐스케이드(Viola-Jones) 객체 검출기에 대한 지원이 포함되어 있습니다.

이 툴박스는 전이 학습을 사용하여 객체 검출기를 훈련시킬 수 있는 함수를 제공합니다. 또한 이 툴박스는 훈련 데이터를 관리하고 전처리하는 기능과 데이터 증강 툴을 제공하여, 실제 환경의 변화를 시뮬레이션함으로써 강인한 모델로 훈련시킵니다. 자세한 내용은 Get Started with Image Preprocessing and Augmentation for Deep Learning 항목을 참조하십시오.

사전 훈련된 모델이나 사용자 지정 모델을 사용하여 검출을 생성한 후에는 객체 검출기 분석기 앱을 사용하여 검출 결과를 ground truth 데이터와 비교할 수 있습니다. 이 앱을 사용하면 다양한 IoU(Intersection over Union) 임계값 범위에서 혼동행렬, 정밀도, 재현율, F1 점수, mAP(mean Average Precision)와 같은 주요 성능 메트릭을 평가할 수 있습니다. 또는 evaluateObjectDetection 함수를 사용하여 검출 성능 메트릭을 평가할 수 있습니다. 자세한 내용은 Evaluate Object Detector Performance 항목과 Get Started with Object Detector Analyzer App 항목을 참조하십시오.

Three images: the first contains labeled boats, the second a diagram of a neural network, and the third the keypoints from a person detector overlaid on the image of the people it has detected.

영상 레이블 지정기컴퓨터 비전 응용 분야에서 영상에 레이블 지정
비디오 레이블 지정기Label video for computer vision applications
객체 검출기 분석기Interactively visualize and evaluate object detection results against ground truth (R2026a 이후)

함수

모두 확장

딥러닝 검출기

groundingDinoObjectDetectorDetect and localize objects using Grounding DINO object detector (R2026a 이후)
rtmdetObjectDetectorDetect objects using RTMDet object detector (R2024b 이후)
ssdObjectDetectorDetect objects using SSD deep learning detector
yolov2ObjectDetectorDetect objects using YOLO v2 object detector
yolov3ObjectDetectorDetect objects using YOLO v3 object detector
yolov4ObjectDetectorDetect objects using YOLO v4 object detector (R2022a 이후)
yoloxObjectDetectorDetect objects using YOLOX object detector (R2023b 이후)
peopleDetectorDetect people using pretrained deep learning object detector (R2024b 이후)
faceDetectorDetect faces using pretrained RetinaFace face detector (R2025a 이후)
detectTextCRAFTDetect texts in images by using CRAFT deep learning model (R2022a 이후)
imfindcirclesYOLOFind circles using YOLOX object detector (R2026a 이후)

특징 기반 검출기

acfObjectDetectorDetect objects using aggregate channel features
peopleDetectorACFACF(Aggregate Channel Features)를 사용하여 사람 검출
vision.CascadeObjectDetectorDetect objects using the Viola-Jones algorithm
vision.ForegroundDetectorForeground detection using Gaussian mixture models
vision.BlobAnalysisProperties of connected regions

검출된 객체 선택

selectStrongestBboxSelect strongest bounding boxes from overlapping clusters using nonmaximal suppression (NMS)
selectStrongestBboxMulticlassSelect strongest multiclass bounding boxes from overlapping clusters using nonmaximal suppression (NMS)

훈련 데이터 불러오기

boxLabelDatastoreDatastore for bounding box label data
groundTruthGround truth label data
imageDatastore이미지 데이터의 데이터저장소
objectDetectorTrainingDataCreate training data for an object detector
combine여러 데이터저장소의 데이터 결합

딥러닝 기반 객체 검출기 훈련

trainSSDObjectDetectorTrain SSD deep learning object detector
trainYOLOv2ObjectDetectorTrain YOLO v2 object detector
trainYOLOv3ObjectDetectorTrain YOLO v3 object detector (R2024a 이후)
trainYOLOv4ObjectDetectorTrain YOLO v4 object detector (R2022a 이후)
trainYOLOXObjectDetectorTrain YOLOX object detector (R2023b 이후)

특징 기반 객체 검출기 훈련

trainACFObjectDetectorTrain ACF object detector
trainCascadeObjectDetectorTrain cascade object detector model

딥러닝을 위한 훈련 데이터 증강 및 전처리

balanceBoxLabelsBalance bounding box labels for object detection
bboxcropCrop bounding boxes
bboxeraseRemove bounding boxes
bboxresizeResize bounding boxes
bboxwarpApply geometric transformation to bounding boxes
bbox2pointsConvert rectangle to corner points list
blockLocationsWithROISelect image block locations that contain bounding box ROIs (R2025a 이후)
imwarp영상에 기하 변환 적용
imcrop영상 자르기
imresize이미지 크기 조정
randomAffine2dCreate randomized 2-D affine transformation
centerCropWindow2d사각 형태의 가운데 자르기 윈도우 만들기
randomWindow2dRandomly select rectangular region in image
integralImageCalculate 2-D integral image
transform데이터저장소 변환

R-CNN(Regions With Convolutional Neural Networks)

roiAlignLayerNon-quantized ROI pooling layer for Mask-CNN
roiMaxPooling2dLayerNeural network layer used to output fixed-size feature maps for rectangular ROIs
roialignNon-quantized ROI pooling of dlarray data (R2021b 이후)

YOLO v2(You Only Look Once 버전 2)

yolov2TransformLayerCreate transform layer for YOLO v2 object detection network
spaceToDepthLayerSpace to depth layer

중점 손실

focalCrossEntropyCompute focal cross-entropy loss

SSD(Single Shot Detector)

ssdMergeLayerCreate SSD merge layer for object detection

앵커 상자

estimateAnchorBoxesEstimate anchor boxes for deep learning object detectors
evaluateObjectDetectionEvaluate object detection data set against ground truth (R2023b 이후)
objectDetectionMetricsObject detection quality metrics (R2023b 이후)
mAPObjectDetectionMetricMean average precision (mAP) metric for object detection (R2024a 이후)
bboxOverlapRatioCompute bounding box overlap ratio
bboxPrecisionRecallCompute bounding box precision and recall against ground truth
driseExplain object detection network predictions using D-RISE (R2024a 이후)
cuboid2imgProject cuboids from 3-D world coordinates to 2-D image coordinates (R2022b 이후)
insertObjectAnnotation트루컬러 또는 회색조 영상 또는 비디오에 주석 추가
insertObjectMask Insert masks in image or video stream
insertShape영상 또는 비디오에 형태 삽입
insertText영상 또는 비디오에 텍스트 삽입
showShapeDisplay shapes on image, video, or point cloud

블록

Deep Learning Object Detector훈련된 딥러닝 객체 검출기를 사용하여 객체 검출 (R2021b 이후)

도움말 항목

객체 검출을 위한 Ground Truth 및 훈련 데이터 만들기

사전 훈련된 검출기를 사용하여 객체 검출

객체 검출 결과 평가

추천 예제