Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

tall형 배열 및 mapreduce

Spark® 및 Hadoop® 클러스터와 병렬 풀에서 MATLAB® tall형 배열과 데이터저장소 또는 mapreduce를 사용하여 빅데이터 세트를 병렬로 분석합니다.

Parallel Computing Toolbox™를 사용하면 데스크탑에서 병렬 풀을 사용하여 tall형 배열 표현식을 병렬로 실행할 수 있습니다. tall형 배열을 사용하면 컴퓨터의 메모리에 담을 수 없는 빅데이터 응용 프로그램을 실행할 수 있습니다. 또한 Parallel Computing Toolbox를 사용하면 MATLAB Parallel Server™ 클러스터에서 실행 중인 병렬 풀에 연결하여 tall형 배열 처리를 확장할 수도 있습니다. 또는 MATLAB Parallel Server를 구동하는 Spark 지원 Hadoop 클러스터를 사용할 수 있습니다. 자세한 내용은 Big Data Workflow Using Tall Arrays and Datastores 항목을 참조하십시오.

함수

모두 확장

tallCreate tall array
datastore대규모의 데이터 모음을 저장할 데이터저장소 만들기
mapreduce메모리에 담을 수 없을 정도로 큰 데이터 세트를 분석하기 위한 프로그래밍 기법
mapreducerDefine parallel execution environment for mapreduce and tall arrays
partition데이터저장소 파티셔닝
numpartitions데이터저장소 파티션 개수

클래스

모두 확장

parallel.Pool워커의 병렬 풀
parallel.cluster.HadoopHadoop cluster for mapreducer, mapreduce and tall arrays
parallel.cluster.SparkSpark cluster for mapreducer, mapreduce and tall arrays (R2022b 이후)

예제 및 방법

개념