Computer Vision Toolbox

컴퓨터 비전, 3D 비전 및 비디오 처리 시스템을 설계하고 테스트할 수 있습니다.

Computer Vision Toolbox™는 컴퓨터 비전, 3D 비전, 비디오 처리 시스템을 설계하고 테스트하기 위한 알고리즘, 함수 및 앱을 제공합니다. 특징 검출, 특징 추출 및 특징 매칭과 더불어 객체 검출 및 객체 추적을 수행할 수 있습니다. 단일 카메라, 스테레오 카메라, 어안 카메라의 보정 워크플로를 자동화할 수 있습니다. 3D 비전의 경우, 이 툴박스는 시각적 SLAM과 포인트 클라우드 SLAM, 스테레오 비전, 움직임 기반 구조, 포인트 클라우드 처리를 지원합니다. 컴퓨터 비전 앱을 통해 실측 데이터 레이블 지정과 카메라 보정 워크플로를 자동화할 수 있습니다.

YOLO v2, SSD, ACF 등의 딥러닝 및 머신러닝 알고리즘을 사용하여 사용자 지정 객체 검출기를 훈련시킬 수 있습니다. 의미론적 분할과 인스턴스 분할의 경우, U-Net 및 Mask R-CNN 같은 딥러닝 알고리즘을 사용할 수 있습니다. 이 툴박스는 메모리에 담을 수 없을 정도로 큰 영상을 분석할 때 사용할 수 있는 객체 검출 알고리즘과 분할 알고리즘을 제공합니다. 사전 훈련된 모델로 얼굴, 보행자, 기타 일반 객체를 검출할 수 있습니다.

알고리즘을 멀티코어 프로세서와 GPU에서 실행하여 가속화할 수 있습니다. 툴박스 알고리즘은 기존 코드와의 통합, 데스크탑 프로토타이핑, 임베디드 비전 시스템 배포를 위한 C/C++ 코드 생성을 지원합니다.

시작하기:

딥러닝과 머신러닝

딥러닝과 머신러닝을 사용하여 객체를 검출하고 인식하며 분할할 수 있습니다.

객체 검출 및 인식

YOLO v2, Faster R-CNN, ACF, Viola-Jones와 같은 객체 검출기를 훈련, 평가, 배포할 수 있습니다. OCR과 BoVW(시각적 단어 가방)로 객체 인식을 수행할 수 있습니다. 사전 훈련된 모델을 사용하여 얼굴, 보행자, 기타 일반적인 객체를 검출할 수 있습니다.

Faster R-CNN을 이용한 객체 검출.

의미론적 분할

SegNet, FCN, U-Net, DeepLab v3+ 등의 신경망으로 개별 픽셀과 복셀을 분류하여 영상과 3D 볼륨을 분할할 수 있습니다. 인스턴스 분할을 사용하여 분할 지도를 작성하고 고유한 객체의 인스턴스를 검출할 수 있습니다.

Mask R-CNN을 사용한 인스턴스 분할.

실측 데이터 레이블 지정

Video Labeler 앱과 Image Labeler 앱을 사용하여 객체 검출, 의미론적 분할, 인스턴스 분할, 장면 분류의 레이블 지정을 자동화할 수 있습니다.

Video Labeler 앱을 사용한 실측 데이터 레이블 지정.

카메라 보정

카메라의 내부, 외부 및 렌즈 왜곡 파라미터를 추정할 수 있습니다.

단일 카메라 보정

Camera Calibrator 앱을 사용하여 체커보드 검출을 자동화하고 핀홀 카메라와 어안 카메라를 보정할 수 있습니다.

스테레오 카메라 보정

스테레오 쌍을 보정하여 깊이를 계산하고 3D 장면을 재구성할 수 있습니다.

시각적 SLAM 및 3D 비전

한 장면에 대한 여러 2D 보기에서 3D 구조를 추출할 수 있습니다. 시각적 주행거리 측정을 사용하여 카메라의 움직임과 자세를 추정하고, 시각적 SLAM을 사용하여 자세 추정값을 개선할 수 있습니다.

다시점 움직임 기반 구조.

시각적 SLAM을 위한 특징 검출과 매칭.

스테레오 비전

스테레오 카메라 쌍을 사용하여 깊이를 추정하고 3D 장면을 재구성할 수 있습니다.

스테레오 비전을 사용하여 장면에 있는 점의 상대적 심도 추정.

라이다 및 3D 포인트 클라우드 처리

라이다 데이터 또는 3D 포인트 클라우드 데이터로 기하학적 형상에 대해 분할, 군집, 다운샘플, 잡음 제거, 정합, 피팅을 수행할 수 있습니다. Lidar Toolbox™는 라이다 처리 시스템을 설계, 분석, 테스트하기 위한 추가 기능을 제공합니다.

라이다 및 포인트 클라우드 I/O

파일, 라이다 시스템 및 RGB-D 센서에서 포인트 클라우드를 읽고 쓰고 표시할 수 있습니다.

포인트 클라우드 뷰어를 사용하여 스트리밍 포인트 클라우드 데이터를 시각화합니다.

포인트 클라우드 정합

NDT(Normal-Distributions Transform), ICP(Iterative Closest Point), CPD(Coherent Point Drift) 알고리즘을 사용하여 3D 포인트 클라우드를 정합할 수 있습니다.

일련의 포인트 클라우드의 정합 및 스티칭.

분할 및 형상 맞춤

포인트 클라우드를 클러스터로 분할하고 기하학적 형상을 포인트 클라우드에 피팅할 수 있습니다. 자율주행 및 로봇공학 응용 분야를 위해 라이다 데이터의 지상 평면을 분할할 수 있습니다.

포인트 클라우드 분할을 사용하여 포인트 클라우드에서 클러스터를 식별합니다.

특징 검출, 추출, 매칭

객체 검출, 영상 정합, 객체 인식을 위해 특징 기반 워크플로를 사용할 수 있습니다.

혼잡한 장면에서 점 특징 검출, 추출, 매칭을 이용한 객체 검출.

특징 기반 영상 정합

여러 영상에 걸쳐 특징들을 매칭시켜 영상 간의 기하학적 변환을 추정하고 영상 시퀀스를 정합할 수 있습니다.

특징 기반 정합으로 만든 파노라마.

객체 추적 및 모션 추정

비디오와 영상 시퀀스에서 움직임을 추정하고 객체를 추적할 수 있습니다.

추적 중인 객체의 궤적을 점선으로 표시합니다.

모션 추정

광학 흐름, 블록 매칭, 형판 매칭을 사용하여 비디오 프레임 간의 움직임을 추정할 수 있습니다.

고정 카메라를 사용한 움직이는 객체의 검출.

OpenCV 인터페이스

OpenCV 기반 프로젝트 및 함수를 MATLAB 및 Simulink에 통합할 수 있습니다.

코드 생성

컴퓨터 비전 알고리즘 개발을 신속 프로토타이핑, 구현 및 검증 워크플로와 통합할 수 있습니다.