데이터 탐색, 머신러닝 모델 구축,
MATLAB 은 데이터에 액세스하여 전처리하고, 머신러닝과 예측 모델을 구축하며, 엔터프라이즈 IT 시스템에 모델을 배포하는 툴을 제공하여 데이터 과학을 쉽게 만들어 줍니다.
- 플랫 파일, 데이터베이스, 데이터 기록 및 클라우드 스토리지에 저장된 데이터에 액세스하거나 데이터 수집 하드웨어 및 금융 데이터 피드와 같은 실시간 소스에 연결
- 지상 실측 데이터의 레이블 지정 작업용 앱을 비롯하여, 프로그래밍 방식 및 대화형 방식으로 데이터를 준비할 수 있도록 데이터형과 전처리 기능을 사용하여 데이터 관리 및 정리
- MATLAB 그래픽과 라이브 편집기 노트북 환경을 통한데이터 분석 문서화
- 센서, 텍스트, 이미지, 비디오 및 기타 유형의 데이터에 대한 분야별 특징 공학 기법 적용
- 머신러닝과 딥러닝 앱을 사용하여 다양한 모델링 접근 방식 탐구
- 자동 특징 선택, 모델 선택 및 하이퍼파라미터 조정 알고리즘을 사용하여 머신러닝과 딥러닝 모델을 미세 조정
- 다른 언어로 다시 코딩하지 않고도 프로덕션 IT 시스템에 머신러닝 모델 배포
- 머신러닝 모델을 독립형 C/C++ 코드로 자동 변환
데이터 과학에 MATLAB을 사용하는 이유
탐색적 데이터 분석
데이터 전처리 시간을 절약할 수 있습니다. 시계열 센서 데이터부터 이미지, 그리고 텍스트에 이르기까지 MATLAB 데이터형은 데이터 전처리에 필요한 시간을 크게 줄여줍니다. 하이 레벨 함수를 사용하여 서로 다른 시계열 데이터를 쉽게 동기화하고, 이상값을 보간 값으로 대체하고, 잡음이 있는 신호를 필터링하고, 원시 텍스트를 단어들로 분할하는 등의 작업을 쉽게 수행할 수 있습니다. 플롯과 라이브 편집기를 통해 데이터를 신속하게 시각화하여 추세를 파악하고 데이터 품질 문제를 식별할 수 있습니다.
응용 머신러닝
최고의 머신러닝 모델을 찾을 수 있습니다. 머신러닝을 시작하는 데 도움이 필요한 초보자이든, 다양한 유형의 모델을 신속하게 평가하려는 전문가이든 상관없이 분류와 회귀를 도와주는 앱을 사용하면 빠른 결과를 얻을 수 있습니다. 가장 널리 사용되는 분류와 회귀 알고리즘 중에서 선택하고, 표준 측정법에 기반하여 모델들을 비교하고, 향후 분석과 통합을 위해 유망한 모델을 내보낼 수 있습니다. 코드를 직접 작성하는 것이 더 적성에 맞는다면 모델 훈련 함수에 내장된 하이퍼파라미터 최적화를 사용하여 모델을 조정하는 데 가장 적합한 파라미터를 빠르게 찾을 수 있습니다.
멀티 플랫폼 배포
C/C++ 코드, CUDA® 코드, 엔터프라이즈 IT 시스템 또는 클라우드 등 어디에나 머신러닝 모델을 배포할 수 있습니다. 성능이 중요한 경우 MATLAB 코드에서 독립형 C 코드를 생성하여 예측 속도가 빠르고 메모리 사용량이 적은, 배포 가능한 모델을 만들 수 있습니다. 또한, Simulink에서 사용할 목적으로 머신러닝 모델을 내보내거나 MATLAB Production Server에 모델을 배포하여 웹, 데이터베이스 및 엔터프라이즈 응용 프로그램과 통합할 수 있습니다.