주요 콘텐츠

Computer Vision Toolbox

컴퓨터 비전 시스템 설계 및 테스트

Computer Vision Toolbox™는 컴퓨터 비전 시스템을 설계하고 테스트하기 위한 알고리즘 및 앱을 제공합니다. 특징 검출, 특징 추출 및 특징 매칭과 더불어 외관 검사, 객체 검출 및 객체 추적을 수행할 수 있습니다. 단일 카메라, 어안 카메라, 스테레오 카메라, 다중 카메라 구성을 위한 보정 워크플로를 자동화할 수 있습니다. 3차원 비전을 위해 스테레오 비전, 포인트 클라우드 처리, 움직임 기반 구조, 실시간 시각 기반 SLAM과 포인트 클라우드 SLAM을 지원합니다. 컴퓨터 비전 앱을 통해, 카메라 보정뿐만 아니라 자동화를 통해 팀 기반의 ground truth 레이블 지정이 가능합니다.

이 툴박스는 사전 훈련된 CNN(컨벌루션 신경망), Vision Transformer, 비전-언어 모델 등 다양한 AI 기법을 제공합니다. 이러한 기본 제공 모델을 사용하여 영상 분류, 객체 검출, 분할, 자세 추정, 캡션 생성, OCR(광학 문자 인식)과 같은 작업을 수행할 수 있으며, 전이 학습을 통해 모델을 추가로 사용자 지정할 수 있습니다.

C 및 C++ 코드, GPU 실행을 위한 코드, HDL(하드웨어 기술 언어) 코드를 생성할 수 있습니다.

Computer Vision Toolbox 시작하기

Computer Vision Toolbox의 기본 사항 배우기

특징 검출, 추출 및 매칭

관심점 검출, 특징 설명자 추출, 특징 매칭, 영상 정합 및 영상 검색

Ground Truth 영상 및 비디오

AI 지원 자동화를 사용하여 영상과 비디오에 레이블을 대화형 방식으로 지정, AI 모델을 위한 훈련 데이터 만들기, 대규모 데이터 세트에 대한 레이블 지정을 협업 팀 기반으로 관리

객체 검출 및 분할

AI 모델을 사용한 객체 검출, 텍스트 인식(OCR), 바코드 인식, 기준 마커(fiducial marker) 인식, 의미론적 분할과 인스턴스 분할 수행

영상과 비디오 분류하기

AI 모델을 사용한 영상과 비디오 분류 및 행동 인식 수행

비전-언어 모델

비전-언어 모델을 사용한 영상 분류, 검색, 캡션 생성 및 객체 검출 작업 수행

카메라 보정하기

단일 카메라, 어안 카메라, 스테레오 카메라, 다중 카메라, 로봇 핸드-아이 구성을 위해 내부 파라미터 및 외부 파라미터 보정 워크플로 자동화

3차원 비전

카메라 자세 추정, 스테레오 비전 수행, 스테레오 또는 움직임 기반 구조(SfM)를 이용한 3차원 장면 복원, 관성 센서 융합을 사용한 실시간 시각 SLAM 구현

객체를 추적하고 움직임 추정하기

여러 객체 추적, 특징점 추적, 객체 재식별(ReID), 광학 흐름, 형판 매칭