이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.
datastore
함수는 데이터저장소를 만듭니다. 데이터저장소는 메모리에 담을 수 없을 정도로 큰 데이터를 모아 놓는 저장 공간입니다. 데이터저장소를 사용하면 디스크상의 여러 파일이나 원격 위치 또는 데이터베이스에 저장되어 있는 데이터를 단일 엔터티로 읽고 처리할 수 있습니다. 데이터가 너무 커서 메모리를 초과하는 경우에는 데이터의 점진적 가져오기 작업을 관리하거나, tall
형 배열을 만들어 데이터로 작업하거나, 추가 처리를 위해 데이터저장소를 mapreduce
에 대한 입력값으로 사용할 수 있습니다. 자세한 내용은 데이터저장소 시작하기 항목을 참조하십시오.
데이터저장소는 하나의 파일, 또는 여러 파일이나 데이터의 모음을 읽기 위한 객체입니다.
Select Datastore for File Format or Application
Choose the right datastore based on the file format of your data or application.
테이블 형식의 대용량 텍스트 파일 읽어오기 및 분석하기
이 예제에서는 테이블 형식의 데이터가 포함된 대용량 텍스트 파일을 위한 데이터저장소를 생성한 다음, 한 번에 데이터 블록 하나씩 또는 파일 하나씩을 읽어오고 처리하는 방법을 보여줍니다.
This example shows how to create a datastore for a collection of images, read the image files, and find the images with the maximum average hue, saturation, and brightness (HSV).
Read and Analyze MAT-File with Key-Value Data
This example shows how to create a datastore for key-value pair data in a MAT-file that is the output of mapreduce
.
Read and Analyze Hadoop Sequence File
This example shows how to create a datastore for a Sequence file containing key-value data.
Amazon S3™, Microsoft® Azure® Storage Blob 또는 HDFS™의 원격 데이터로 작업합니다.
Set Up Datastore for Processing on Different Machines or Clusters
Setup a datastore on your machine that can be loaded and processed on another machine or cluster.
Create a fully customized datastore for your custom or proprietary data.
Develop Custom Datastore for DICOM Data
This example shows how to develop a custom datastore that supports writing operations.
Testing Guidelines for Custom Datastores
After implementing your custom datastore, follow this test procedure to qualify your custom datastore.