파일 형식 또는 응용 프로그램에 맞는 데이터저장소 선택하기
데이터저장소는 메모리에 담을 수 없을 정도로 큰 데이터를 모아 놓는 리포지토리입니다. 각 파일 형식과 응용 프로그램에는 서로 다른 유형의 데이터저장소가 사용되며, 그러한 데이터저장소에는 지원되는 데이터 또는 응용 프로그램의 유형에 맞는 속성이 포함되어 있습니다. MATLAB®은 Excel® 파일과 같은 표준 파일 형식을 위한 데이터저장소와 딥러닝과 같은 특정 응용 프로그램을 위한 데이터저장소를 제공합니다. 기존 데이터저장소 외에도, 데이터가 사유 형식인 경우 사용자 지정 데이터저장소 프레임워크를 사용하여 사용자 지정 데이터저장소를 개발할 수 있습니다.
표준 파일 형식용 데이터저장소
표준 파일 형식으로 데이터를 수집하려면 다음 옵션 중 하나를 사용하십시오.
데이터저장소 | 설명 |
---|---|
TabularTextDatastore | 열 방향 데이터를 포함하는 텍스트 파일(예: CSV 파일) |
SpreadsheetDatastore | 지원되는 Excel 형식의 스프레드시트 파일(예: |
ImageDatastore |
|
ParquetDatastore | 열 방향 데이터를 포함하는 Parquet 파일 |
FileDatastore | 비표준 파일 형식의 파일 사용자 지정 파일 읽기 함수가 필요함 |
기존 데이터저장소를 변환하거나 결합합니다.
데이터저장소 | 설명 |
---|---|
CombinedDatastore | 여러 기본 데이터저장소에서 읽어온 데이터를 결합하기 위한 데이터저장소 |
SequentialDatastore | 여러 기본 데이터저장소에서 순차적으로 데이터 읽어오기 |
TransformedDatastore | 기본 데이터저장소를 변환하기 위한 데이터저장소 |
MapReduce와 tall형 배열을 통합하기 위한 데이터저장소입니다.
데이터저장소 | 설명 |
---|---|
KeyValueDatastore |
|
TallDatastore |
|
특정 응용 프로그램을 위한 데이터저장소
응용 프로그램에 따라 다음 데이터저장소 중 하나를 사용하십시오.
응용 프로그램 | 데이터저장소 | 설명 | 필요한 툴박스 |
---|---|---|---|
Simulink 모델 데이터 | SimulationDatastore (Simulink) | Simulink® 모델에 사용할 시뮬레이션 입력 및 출력 데이터를 위한 데이터저장소 | Simulink |
시뮬레이션 앙상블 및 예측 정비 데이터 | simulationEnsembleDatastore (Predictive Maintenance Toolbox) | 시뮬레이션 앙상블 데이터 관리를 위한 데이터저장소 | Predictive Maintenance Toolbox™ |
fileEnsembleDatastore (Predictive Maintenance Toolbox) | 사용자 지정 파일 형식으로 앙상블 데이터를 관리하기 위한 데이터저장소 | Predictive Maintenance Toolbox | |
MDF(Measurement Data Format) 파일 | mdfDatastore (Vehicle Network Toolbox) | MDF 파일 모음을 위한 데이터저장소 | Vehicle Network Toolbox™ |
mdfDatastore (Powertrain Blockset) | MDF 파일 모음을 위한 데이터저장소 | Powertrain Blockset™ | |
딥러닝 이미지 또는 시퀀스 데이터 전처리를 위한 데이터저장소 | pixelLabelDatastore (Computer Vision Toolbox) | 픽셀 레이블 데이터를 위한 데이터저장소 | Computer Vision Toolbox™ 및 Deep Learning Toolbox™ |
pixelLabelImageDatastore (Computer Vision Toolbox) | 의미론적 분할 신경망 훈련을 위한 데이터저장소 데이터저장소는 비결정적임 | Computer Vision Toolbox 및 Deep Learning Toolbox | |
boxLabelDatastore (Computer Vision Toolbox) | 경계 상자 레이블 데이터를 위한 데이터저장소 | Computer Vision Toolbox 및 Deep Learning Toolbox | |
signalDatastore (Signal Processing Toolbox) | 신호 파일 모음을 위한 데이터저장소 | Signal Processing Toolbox™ 및 Deep Learning Toolbox | |
randomPatchExtractionDatastore (Image Processing Toolbox) | 영상 또는 픽셀 레이블 영상에서 무작위 패치를 추출하기 위한 데이터저장소 데이터저장소는 비결정적임 | Image Processing Toolbox™ 및 Deep Learning Toolbox | |
denoisingImageDatastore (Image Processing Toolbox) | 영상 잡음 제거 심층 신경망 훈련을 위한 데이터저장소 데이터저장소는 비결정적임 | Image Processing Toolbox 및 Deep Learning Toolbox | |
augmentedImageDatastore (Deep Learning Toolbox) | 훈련 영상의 크기 조정 및 증대를 위한 데이터저장소 데이터저장소는 비결정적임 | Deep Learning Toolbox | |
오디오 데이터 | audioDatastore (Audio Toolbox) | 오디오 파일 모음을 위한 데이터저장소 | Audio Toolbox™ |
메모리에 담을 수 없는 큰 영상 데이터 | blockedImageDatastore (Image Processing Toolbox) | 메모리에 담을 수 없을 정도로 큰 단일 영상의 블록 관리를 위한 데이터저장소 | Image Processing Toolbox |
데이터베이스 데이터 | databaseDatastore (Database Toolbox) | 관계형 데이터베이스의 데이터 모음을 위한 데이터저장소 | Database Toolbox™ |
사용자 지정 파일 형식
사용자 지정 파일 형식으로 데이터를 수집할 경우 각 개별 파일이 메모리에 담겨진다면 사용자 지정 파일 읽기 함수와 함께 FileDatastore
를 사용하십시오. 그 외의 경우에는 matlab.io.Datastore
클래스를 사용하여 사용자 지정 데이터 또는 사유 데이터용으로 완전히 사용자 지정된 데이터저장소를 개발하십시오. Develop Custom Datastore 항목을 참조하십시오.
비결정적 데이터저장소
reset
함수 호출 후에 read
함수를 호출할 경우 정확히 동일한 데이터를 반환하지 않는 데이터저장소가 비결정적 데이터저장소입니다. tall
형 배열이나 mapreduce
또는 두 번 이상 데이터를 읽어와야 하는 그 외 모든 코드에는 비결정적 데이터저장소를 사용하지 마십시오.
일부 응용 프로그램에는 무작위로 증대되거나 변형되는 데이터가 필요합니다. 예를 들어 딥러닝 응용 프로그램의 augmentedImageDatastore
(Deep Learning Toolbox) 데이터저장소는 신경망이 훈련 영상의 정확한 세부 정보를 과적합하고 기억하는 것을 방지하기 위해 무작위 전처리 작업으로 훈련 영상 데이터를 증대합니다. 이 데이터저장소의 출력값은 reset
호출 후에 read
연산을 수행할 때마다 달라집니다.
참고 항목
TabularTextDatastore
| SpreadsheetDatastore
| ImageDatastore
| FileDatastore
| TallDatastore
| tall