Main Content

데이터 전처리

딥러닝에 사용할 시퀀스 및 테이블 형식 데이터 관리 및 전처리

데이터 전처리는 딥러닝 워크플로의 일반적인 첫 번째 단계로, 신경망이 받아들일 수 있는 형식으로 원시 데이터를 준비하는 작업입니다. 예를 들어 원하는 특징을 강화하거나 신경망에 편향을 유발할 수 있는 아티팩트를 줄이는 방향으로 데이터를 전처리할 수 있습니다. 예를 들어, 입력 데이터를 정규화하거나 입력 데이터에서 잡음을 제거할 수 있습니다.

MATLAB®과 Deep Learning Toolbox™에서 제공하는 데이터저장소와 함수를 사용하여 정규화와 같은 연산으로 시퀀스 입력을 전처리할 수 있습니다. 다른 MATLAB 툴박스들도 딥러닝 데이터의 레이블 지정, 처리, 증대를 위한 함수, 데이터저장소 및 앱을 제공합니다. 다른 MATLAB 툴박스들의 특화된 툴을 사용하여 오디오, 텍스트, 신호 처리와 같은 분야의 데이터를 처리할 수 있습니다.

비디오 레이블 지정기Label video for computer vision applications
Ground Truth 레이블 지정기Label ground truth data for automated driving applications
신호 레이블 지정기관심 있는 신호 특성, 신호 영역, 신호 지점에 레이블 지정 및 특징 추출

함수

transform데이터저장소 변환
combine여러 데이터저장소의 데이터 결합
TransformedDatastore기본 데이터저장소를 변환하는 데이터저장소
CombinedDatastore여러 개의 기본 데이터저장소에서 읽은 데이터를 결합할 데이터저장소
padsequencesPad or truncate sequence data to same length (R2021a 이후)
minibatchqueueCreate mini-batches for deep learning (R2020b 이후)

도움말 항목