Computer Vision Toolbox는 컴퓨터 비전 시스템의 설계 및 테스트를 위한 알고리즘과 앱을 제공합니다. 특징 검출, 특징 추출 및 특징 매칭과 더불어 외관 검사, 객체 검출 및 객체 추적을 수행할 수 있습니다. 단일 카메라, 스테레오 카메라, 어안 카메라의 보정 워크플로를 자동화할 수 있습니다. 3차원 비전의 경우, 이 툴박스는 스테레오 비전, 포인트 클라우드 처리, 움직임 기반 구조, 실시간 시각적 SLAM과 포인트 클라우드 SLAM을 지원합니다. 컴퓨터 비전 앱을 사용하면 카메라 보정과 더불어 자동화를 활용한 팀 기반 ground truth 레이블 지정을 수행할 수 있습니다.
사전 훈련된 객체 검출기를 사용하거나 YOLO, SSD, ACF 등의 딥러닝 및 머신러닝 알고리즘을 사용하여 사용자 지정 검출기를 훈련시킬 수 있습니다. 의미론적 분할과 인스턴스 분할의 경우, U-Net, SOLO 및 Mask R-CNN 같은 딥러닝 알고리즘을 사용할 수 있습니다. ViT 같은 비전 트랜스포머를 사용하여 영상 분류를 수행할 수 있습니다. 사전 훈련된 모델을 사용하여 얼굴과 보행자를 검출하고, OCR(광학 문자 인식)을 수행하고, 기타 일반 객체를 인식할 수 있습니다.
알고리즘을 멀티코어 프로세서 및 GPU에서 실행하여 가속화할 수 있습니다. 툴박스 알고리즘은 기존 코드와의 통합, 데스크탑 프로토타이핑, 임베디드 비전 시스템 배포를 위한 C/C++ 코드 생성을 지원합니다.
영상 및 비디오 ground truth 레이블 지정
비디오 레이블 지정기 앱과 영상 레이블 지정기 앱을 사용하여 객체 검출, 의미론적 분할, 인스턴스 분할, 장면 분류의 레이블 지정을 자동화할 수 있습니다.
딥러닝과 머신러닝
머신러닝 모델 및 딥러닝 신경망을 훈련시키거나 사전 훈련된 신경망을 사용하여 객체 검출과 분할을 수행할 수 있습니다. 이러한 신경망의 성능을 평가하고 C/C++ 또는 CUDA® 코드를 생성하여 신경망을 배포할 수 있습니다.
자동 외관 검사
제조 품질 보증 공정의 일환으로서 자동 외관 검사 라이브러리를 사용하여 이상이나 결함을 자동으로 식별할 수 있습니다.
시각적 SLAM 및 3차원 비전
다수의 2차원 뷰에서 장면의 3차원 구조를 추출할 수 있습니다. 주변 환경을 기준으로 카메라의 위치와 방향을 추정할 수 있습니다. 번들 조정 및 자세 그래프 최적화를 사용하여 자세 추정값을 개선할 수 있습니다.
라이다 및 3차원 포인트 클라우드 처리
라이다 데이터 또는 3차원 포인트 클라우드 데이터로 기하학적 형상에 대해 분할, 군집화, 다운샘플링, 잡음 제거, 정합, 피팅을 수행할 수 있습니다. Lidar Toolbox는 라이다 처리 시스템을 설계, 분석, 테스트하기 위한 추가 기능을 제공합니다.
특징 검출, 추출, 매칭
여러 영상에 걸쳐 블롭, 경계, 코너 등의 특징들을 검출, 추출하고 매칭할 수 있습니다. 서로 일치하는 특징을 정합이나 객체 분류에, 또는 SLAM 같은 복잡한 워크플로에서 사용할 수 있습니다.
코드 생성과 타사 지원
컴퓨터 비전 알고리즘으로부터 코드를 생성하여 신속 프로토타이핑, 배포 및 검증을 수행할 수 있습니다. OpenCV 기반 프로젝트 및 함수를 MATLAB 및 Simulink에 통합할 수 있습니다.
제품 관련 자료:
“단 몇 줄의 MATLAB 코드만으로 머신러닝 기능을 사용할 수 있습니다. 그러면 엔지니어는 훈련된 분류기를 직접적 개입이나 공정 지연 없이 코드 생성을 통해 컴퓨터에 배포할 수 있습니다.”
Larry Mianzo, Caterpillar