MATLAB Interface for Databricks®을 사용하면 클라우드에 있는 데이터 및 연산 기능을 이용할 수 있습니다. 원격으로 빅데이터셋에 액세스하여 쿼리하거나 Databricks 클러스터에서 실행할 MATLAB 코드를 배포할 수 있습니다.
- Databricks에서 SQL을 사용해 데이터 작업 수행
- MATLAB에서 대화형 방식으로 Spark™ 사용
- 컴파일된 MATLAB 알고리즘을 Databricks에서 실행
- Python®으로 작업하는 다른 Databricks 사용자와 MATLAB 알고리즘 공유
SQL을 사용한 빅데이터 액세스
Database Toolbox를 사용해 Databricks 클러스터를 MATLAB에 연결하고 이를 통해 클라우드 데이터 소스에 액세스할 수 있습니다. Databricks에서 데이터를 원격으로 조작하고 SQL을 사용하여 테이블 형식 데이터에 액세스할 수 있습니다. Apache® Spark™ SQL을 사용하여 Spark 워크플로에서 데이터를 쿼리할 수 있습니다.
데이터로 MATLAB 배포
MATLAB Runtime을 사용해 Databricks 클러스터에 배포하기 위해 MATLAB Compiler SDK 및 Simulink Compiler를 사용해 알고리즘을 패키징할 수 있습니다. 배포된 알고리즘은 노트북에서 실행하거나 온디맨드 방식의 예약된 작업으로 실행할 수 있습니다. 이러한 알고리즘을 사용하여 데이터 처리 파이프라인에 통합할 수 있습니다.
프로그래밍 방식으로 Databricks과 상호 작용
REST API를 사용하면 MATLAB에서 Databricks 환경과 프로그래밍 방식으로 상호 작용하여 Databricks 내 작업 또는 클러스터를 제어할 수 있습니다.