주요 콘텐츠

인스턴스 분할

ground truth에 레이블 지정, SOLOv2, Mask R-CNN, SAM과 같은 사전 훈련된 AI 모델을 사용하여 인스턴스 분할 수행, 전이 학습을 통해 사용자 지정 신경망 훈련

Computer Vision Toolbox™의 인스턴스 분할 툴을 사용하면 여러 객체가 중첩되어 있는 경우에도 영상 내의 개별 객체를 검출, 분류, 분할할 수 있습니다. 영상 레이블 지정기 앱과 비디오 레이블 지정기 앱을 사용하여 레이블이 지정된 ground truth를 만드는 것부터 시작할 수 있습니다. 이 두 앱은 대화형 및 AI 지원 방식으로 객체 인스턴스에 대해 다각형 ROI나 사각형 ROI를 사용한 주석 처리를 지원합니다. 자세한 내용은 Label Objects Using Polygons for Instance Segmentation 항목을 참조하십시오.

이 툴박스는 SOLOv2, Mask R-CNN과 같은 사전 훈련된 인스턴스 분할 신경망을 제공합니다. 이러한 모델을 바로 추론에 사용하거나 전이 학습을 통해 특정 응용 분야에 맞게 조정할 수 있습니다. 자세한 내용은 Get Started with Instance Segmentation Using Deep Learning 항목과 Get Started with SOLOv2 for Instance Segmentation 항목을 참조하십시오. 클래스에 독립적인 인스턴스 분할을 위해, 이 툴박스는 imsegsam 함수와 segmentAnythingModel 객체를 통해 SAM(Segment Anything Model)을 지원합니다.

훈련 데이터를 준비하기 위해, 이 툴박스는 데이터 세트를 관리하고 구성하는 유틸리티와 함께 데이터 증강 및 전처리 기능을 제공합니다. 자세한 내용은 Postprocess Exported Labels for Instance Segmentation Training 항목을 참조하십시오.

사전 훈련된 모델이나 사용자 지정 모델을 사용하여 예측을 생성한 후에는, 인스턴스 분할 성능을 평가하고 분할 정확도, 객체 수준 정밀도, 그리고 서로 다른 객체 크기별 성능에 대한 상세한 정보를 생성할 수 있습니다. 이러한 메트릭은 마스크 예측과 경계 상자 위치추정의 품질을 평가하는 데 유용합니다. 자세한 내용은 evaluateInstanceSegmentation 항목을 참조하십시오.

이 툴박스는 Pose Mask R-CNN 프레임워크를 통해 인스턴스 분할을 사용한 3차원 객체의 자세 추정도 지원하여, 이를 통해 객체의 방향과 구조에 대한 정밀한 분석을 가능하게 합니다. 자세한 내용은 Perform 6-DoF Pose Estimation for Bin Picking Using Deep Learning 항목을 참조하십시오.

Instance segmentation using SOLOv2: Left — A segmented and labeled road scenario using a sample modified RGB image from the CamVid data set, Right — A segmented image of PVC pipe connectors

영상 레이블 지정기컴퓨터 비전 응용 분야에서 영상에 레이블 지정
비디오 레이블 지정기Label video for computer vision applications

함수

모두 확장

SOLOv2

solov2Segment objects using SOLOv2 instance segmentation network (R2023b 이후)
segmentObjectsSegment objects using SOLOv2 instance segmentation (R2023b 이후)

Mask R-CNN

maskrcnnDetect objects using Mask R-CNN instance segmentation (R2021b 이후)
segmentObjectsSegment objects using Mask R-CNN instance segmentation (R2021b 이후)

SAM(Segment Anything Model)

imsegsamPerform automatic full image segmentation using Segment Anything Model 2 (SAM 2) (R2024b 이후)
segmentAnythingModel의미론적 분할을 위해 사전 훈련된 SAM(Segment Anything Model) (R2024a 이후)

훈련 데이터 불러오기

boxLabelDatastoreDatastore for bounding box label data
groundTruthGround truth label data
imageDatastore이미지 데이터의 데이터저장소
combine여러 데이터저장소의 데이터 결합

인스턴스 분할 신경망 훈련

trainSOLOV2Train SOLOv2 network to perform instance segmentation (R2023b 이후)
trainMaskRCNNTrain Mask R-CNN network to perform instance segmentation (R2022a 이후)

훈련 데이터 증강 및 전처리

poly2mask관심 영역(ROI) 다각형을 영역 마스크로 변환
bwboundaries이진 영상에서 객체 경계선 추적
balanceBoxLabelsBalance bounding box labels for object detection
bboxcropCrop bounding boxes
bboxeraseRemove bounding boxes
bboxresizeResize bounding boxes
bboxwarpApply geometric transformation to bounding boxes
bbox2pointsConvert rectangle to corner points list
imwarp영상에 기하 변환 적용
imcrop영상 자르기
imresize이미지 크기 조정
randomAffine2dCreate randomized 2-D affine transformation
centerCropWindow2d사각 형태의 가운데 자르기 윈도우 만들기
randomWindow2dRandomly select rectangular region in image
evaluateInstanceSegmentationEvaluate instance segmentation data set against ground truth (R2022b 이후)
instanceSegmentationMetricsInstance segmentation quality metrics (R2022b 이후)
metricsByAreaEvaluate instance segmentation across object mask size ranges (R2023b 이후)
insertObjectMask Insert masks in image or video stream
insertObjectAnnotation트루컬러 또는 회색조 영상 또는 비디오에 주석 추가
insertShape영상 또는 비디오에 형태 삽입
insertText영상 또는 비디오에 텍스트 삽입
showShapeDisplay shapes on image, video, or point cloud
posemaskrcnnPredict object pose using Pose Mask R-CNN pose estimation (R2024a 이후)
predictPoseEstimate object pose using Pose Mask R-CNN deep learning network (R2024a 이후)
trainPoseMaskRCNNTrain Pose Mask R-CNN network to perform pose estimation (R2024a 이후)

도움말 항목

시작하기

인스턴스 분할을 위한 Ground Truth 만들기

인스턴스 분할을 위한 훈련 데이터 준비하기

추천 예제