영상 범주 분류

Vision Transformer 또는 bag-of-visual-words 영상 분류기 생성

Vision Transformer 신경망을 사용하거나 영상을 표현한 시각 단어가 나타나는 횟수를 보여주는 히스토그램을 생성하여 영상을 범주로 분류합니다.

영상 레이블 지정기컴퓨터 비전 응용 분야에서 영상에 레이블 지정
비디오 레이블 지정기Label video for computer vision applications


visionTransformerPretrained vision transformer (ViT) neural network (R2023b 이후)
patchEmbeddingLayerPatch embedding layer (R2023b 이후)
bagOfFeaturesBag-of-visual-words 객체
trainImageCategoryClassifierTrain an image category classifier
imageCategoryClassifierPredict image category
imageDatastore이미지 데이터의 데이터저장소

도움말 항목


  • Get Started with the Image Labeler
    Interactively label rectangular ROIs for object detection, pixels for semantic segmentation, polygons for instance segmentation, and scenes for image classification.
  • Get Started with the Video Labeler
    Interactively label rectangular ROIs for object detection, pixels for semantic segmentation, polygons for instance segmentation, and scenes for image classification in a video or image sequence.

