딥러닝 데이터 전처리
딥러닝을 위한 데이터 관리 및 전처리
데이터 전처리는 딥러닝 워크플로의 일반적인 첫 번째 단계로, 신경망이 받아들일 수 있는 형식으로 원시 데이터를 준비하는 작업입니다. 예를 들어, 영상 입력 계층의 크기와 일치하도록 영상 입력 크기를 조정할 수 있습니다. 원하는 특징을 강화하거나 신경망에 편향을 유발할 수 있는 아티팩트를 줄이는 방향으로 데이터를 전처리할 수도 있습니다. 예를 들어, 입력 데이터를 정규화하거나 입력 데이터에서 잡음을 제거할 수 있습니다.
MATLAB®과 Deep Learning Toolbox™에서 제공하는 데이터저장소와 함수를 사용하여 크기 조정과 같은 연산으로 영상 입력을 전처리할 수 있습니다. 다른 MATLAB 툴박스들도 딥러닝 데이터의 레이블 지정, 처리, 증대를 위한 함수, 데이터저장소 및 앱을 제공합니다. 다른 MATLAB 툴박스들의 특화된 툴을 사용하여 영상 처리, 객체 검출, 의미론적 분할, 신호 처리, 오디오 처리, 텍스트 분석과 같은 분야의 데이터를 처리할 수 있습니다.
앱
영상 레이블 지정기 | 컴퓨터 비전 응용 분야에서 영상에 레이블 지정 |
비디오 레이블 지정기 | Label video for computer vision applications |
실측 레이블 지정기 | Label ground truth data for automated driving applications |
라이다 레이블 지정기 | Label ground truth data in lidar point clouds |
신호 레이블 지정기 | 관심 있는 신호 특성, 신호 영역, 신호 지점에 레이블 지정 및 특징 추출 |
도움말 항목
딥러닝 데이터 전처리
- Data Sets for Deep Learning
Discover data sets for various deep learning tasks. - Create and Explore Datastore for Image Classification
This example shows how to create, read, and augment an image datastore for use in training a deep learning network. - 딥러닝을 위해 영상 전처리하기
훈련, 예측 및 분류를 위해 영상의 크기를 조정하는 방법과 데이터 증대, 변환 및 특화된 데이터저장소를 사용하여 영상을 전처리하는 방법을 알아봅니다. - Preprocess Volumes for Deep Learning
Read and preprocess volumetric image and label data for 3-D deep learning. - Preprocess Data for Domain-Specific Deep Learning Applications
Perform deterministic or randomized data processing for domains such as image processing, object detection, semantic segmentation, signal and audio processing, and text analytics.
실측 훈련 데이터에 레이블 지정
- Choose an App to Label Ground Truth Data
Decide which app to use to label ground truth data: Image Labeler, Video Labeler, Ground Truth Labeler, Lidar Labeler, Signal Labeler, or Medical Image Labeler. - Label Pixels for Semantic Segmentation (Computer Vision Toolbox)
Label pixels for training a semantic segmentation network by using a labeling app. - Get Started with Ground Truth Labelling (Automated Driving Toolbox)
Interactively label multiple lidar and video signals simultaneously. - Custom Labeling Functions (Signal Processing Toolbox)
Create and manage custom labeling functions. - Label Spoken Words in Audio Signals (Signal Processing Toolbox)
Use Signal Labeler to label spoken words in an audio signal.
데이터저장소 사용자 지정
- Datastores for Deep Learning
Learn how to use datastores in deep learning applications. - image-to-image 회귀를 위해 데이터저장소 준비하기
이 예제에서는 image-to-image 회귀 신경망을 훈련시키기 위해ImageDatastore
의transform
함수와combine
함수를 사용하여 데이터저장소를 준비하는 방법을 보여줍니다. - 메모리에 다 담을 수 없는 큰 시퀀스 데이터를 사용하여 신경망 훈련시키기
이 예제에서는 데이터저장소를 변환하고 결합하여 메모리에 다 담을 수 없을 정도로 큰 시퀀스 데이터를 대상으로 딥러닝 신경망을 훈련시키는 방법을 보여줍니다. - Classify Text Data Using Convolutional Neural Network
This example shows how to classify text data using a convolutional neural network. - Classify Out-of-Memory Text Data Using Deep Learning
This example shows how to classify out-of-memory text data with a deep learning network using a transformed datastore.