심층 신경망에 사용할 데이터 전처리하기
딥러닝을 위한 데이터 관리 및 전처리
신경망이 받아들일 수 있는 형식이 되도록 데이터를 전처리하는 작업은 딥러닝 워크플로의 일반적인 첫 번째 단계입니다. 예를 들어, 영상 입력 계층의 크기와 일치하도록 영상 입력 크기를 조정할 수 있습니다. 원하는 특징을 강화하거나 신경망에 편향을 유발할 수 있는 아티팩트를 줄이는 방향으로 데이터를 전처리할 수도 있습니다. 예를 들어, 입력 데이터를 정규화하거나 입력 데이터에서 잡음을 제거할 수 있습니다.
MATLAB®과 Deep Learning Toolbox™에서 제공하는 데이터저장소와 함수를 사용하여 크기 조정과 같은 연산으로 영상 입력을 전처리할 수 있습니다. 다른 MATLAB 툴박스들도 딥러닝 데이터의 레이블 지정, 처리, 증강을 위한 함수, 데이터저장소 및 앱을 제공합니다. 다른 MATLAB 툴박스들의 특화된 툴을 사용하여 영상 처리, 객체 검출, 의미론적 분할, 신호 처리, 오디오 처리, 텍스트 분석과 같은 분야의 데이터를 처리할 수 있습니다.
앱
영상 레이블 지정기 | 컴퓨터 비전 응용 분야에서 영상에 레이블 지정 |
비디오 레이블 지정기 | Label video for computer vision applications |
Ground Truth 레이블 지정기 | Label ground truth data for automated driving applications |
라이다 레이블 지정기 | Label ground truth data in lidar point clouds (R2020b 이후) |
신호 레이블 지정기 | 관심 있는 신호 특성, 신호 영역, 신호 지점에 레이블 지정 및 특징 추출 |
함수
imageDatastore | 이미지 데이터의 데이터저장소 |
augmentedImageDatastore | 배치를 변환하여 영상 데이터 증강 |
imageDataAugmenter | 영상 데이터 증강 구성 |
augment | 동일한 무작위 변환을 여러 개의 영상에 적용 |
minibatchqueue | Create mini-batches for deep learning (R2020b 이후) |
도움말 항목
딥러닝 데이터 전처리
- Data Sets for Deep Learning
Discover data sets for various deep learning tasks. - 딥러닝을 위해 영상 전처리하기
훈련, 예측 및 분류를 위해 영상의 크기를 조정하는 방법과 데이터 증강, 변환 및 특화된 데이터저장소를 사용하여 영상을 전처리하는 방법을 알아봅니다. - Preprocess Volumes for Deep Learning
Read and preprocess volumetric image and label data for 3-D deep learning. - Preprocess Data for Domain-Specific Deep Learning Applications
Perform deterministic or randomized data processing for domains such as image processing, object detection, semantic segmentation, signal and audio processing, and text analytics.
데이터저장소 사용자 지정
- Datastores for Deep Learning
Learn how to use datastores in deep learning applications. - 메모리에 다 담을 수 없는 큰 시퀀스 데이터를 사용하여 신경망 훈련시키기
이 예제에서는 데이터저장소를 변환하고 결합하여 메모리에 다 담을 수 없을 정도로 큰 시퀀스 데이터를 대상으로 딥러닝 신경망을 훈련시키는 방법을 보여줍니다. - Classify Text Data Using Convolutional Neural Network
This example shows how to classify text data using a convolutional neural network. - Optimize Datastores for Deep Learning Performance
Explore methods for speeding up deep learning workflows that use datastores. - Develop Custom Mini-Batch Datastore
Create a fully customized mini-batch datastore that contains training and test data sets for network training, prediction, and classification.
Ground Truth 훈련 데이터에 레이블 지정
- Ground Truth 데이터에 레이블을 지정할 앱 선택
ground truth 데이터에 레이블을 지정하기 위해 사용할 앱을 영상 레이블 지정기, 비디오 레이블 지정기, Ground Truth 레이블 지정기, 라이다 레이블 지정기, 신호 레이블 지정기 또는 Medical Image Labeler 중에서 선택합니다. - Get Started with Ground Truth Labelling (Automated Driving Toolbox)
Interactively label multiple lidar and video signals simultaneously. - Custom Labeling Functions (Signal Processing Toolbox)
Create and manage custom labeling functions. - Label Spoken Words in Audio Signals (Signal Processing Toolbox)
Use Signal Labeler to label spoken words in an audio signal. - Label Pixels for Semantic Segmentation (Computer Vision Toolbox)
Label pixels for training a semantic segmentation network by using a labeling app.