심층 신경망에 사용할 데이터 전처리하기

딥러닝을 위한 데이터 관리 및 전처리

신경망이 받아들일 수 있는 형식이 되도록 데이터를 전처리하는 작업은 딥러닝 워크플로의 일반적인 첫 번째 단계입니다. 예를 들어, 영상 입력 계층의 크기와 일치하도록 영상 입력 크기를 조정할 수 있습니다. 원하는 특징을 강화하거나 신경망에 편향을 유발할 수 있는 아티팩트를 줄이는 방향으로 데이터를 전처리할 수도 있습니다. 예를 들어, 입력 데이터를 정규화하거나 입력 데이터에서 잡음을 제거할 수 있습니다.

MATLAB^®과 Deep Learning Toolbox™에서 제공하는 데이터저장소와 함수를 사용하여 크기 조정과 같은 연산으로 영상 입력을 전처리할 수 있습니다. 다른 MATLAB 툴박스들도 딥러닝 데이터의 레이블 지정, 처리, 증대를 위한 함수, 데이터저장소 및 앱을 제공합니다. 다른 MATLAB 툴박스들의 특화된 툴을 사용하여 영상 처리, 객체 검출, 의미론적 분할, 신호 처리, 오디오 처리, 텍스트 분석과 같은 분야의 데이터를 처리할 수 있습니다.

앱

영상 레이블 지정기	컴퓨터 비전 응용 분야에서 영상에 레이블 지정
비디오 레이블 지정기	Label video for computer vision applications
Ground Truth 레이블 지정기	Label ground truth data for automated driving applications
라이다 레이블 지정기	Label ground truth data in lidar point clouds (R2020b 이후)
신호 레이블 지정기	관심 있는 신호 특성, 신호 영역, 신호 지점에 레이블 지정 및 특징 추출

함수

`imageDatastore`	이미지 데이터의 데이터저장소
`augmentedImageDatastore`	배치를 변환하여 영상 데이터 증대
`imageDataAugmenter`	영상 데이터 증대 구성
`augment`	Apply identical random transformations to multiple images
`minibatchqueue`	Create mini-batches for deep learning (R2020b 이후)

도움말 항목

딥러닝 데이터 전처리

Data Sets for Deep Learning
Discover data sets for various deep learning tasks.
딥러닝을 위해 영상 전처리하기
훈련, 예측 및 분류를 위해 영상의 크기를 조정하는 방법과 데이터 증대, 변환 및 특화된 데이터저장소를 사용하여 영상을 전처리하는 방법을 알아봅니다.
Preprocess Volumes for Deep Learning
Read and preprocess volumetric image and label data for 3-D deep learning.
Preprocess Data for Domain-Specific Deep Learning Applications

Perform deterministic or randomized data processing for domains such as image processing, object detection, semantic segmentation, signal and audio processing, and text analytics.

데이터저장소 사용자 지정

Datastores for Deep Learning
Learn how to use datastores in deep learning applications.
메모리에 다 담을 수 없는 큰 시퀀스 데이터를 사용하여 신경망 훈련시키기
이 예제에서는 데이터저장소를 변환하고 결합하여 메모리에 다 담을 수 없을 정도로 큰 시퀀스 데이터를 대상으로 딥러닝 신경망을 훈련시키는 방법을 보여줍니다.
Classify Text Data Using Convolutional Neural Network
This example shows how to classify text data using a convolutional neural network.
Develop Custom Mini-Batch Datastore
Create a fully customized mini-batch datastore that contains training and test data sets for network training, prediction, and classification.

Ground Truth 훈련 데이터에 레이블 지정

Ground Truth 데이터에 레이블을 지정할 앱 선택
ground truth 데이터에 레이블을 지정하기 위해 사용할 앱을 영상 레이블 지정기, 비디오 레이블 지정기, Ground Truth 레이블 지정기, 라이다 레이블 지정기, 신호 레이블 지정기 또는 Medical Image Labeler 중에서 선택합니다.
Get Started with Ground Truth Labelling (Automated Driving Toolbox)
Interactively label multiple lidar and video signals simultaneously.
Custom Labeling Functions (Signal Processing Toolbox)
Create and manage custom labeling functions.
Label Spoken Words in Audio Signals (Signal Processing Toolbox)
Use Signal Labeler to label spoken words in an audio signal.
Label Pixels for Semantic Segmentation (Computer Vision Toolbox)
Label pixels for training a semantic segmentation network by using a labeling app.

심층 신경망에 사용할 데이터 전처리하기

앱

함수

도움말 항목

딥러닝 데이터 전처리

데이터저장소 사용자 지정

Ground Truth 훈련 데이터에 레이블 지정

추천 예제

Create and Explore Datastore for Image Classification

image-to-image 회귀를 위해 데이터저장소 준비하기

Classify Out-of-Memory Text Data Using Deep Learning