Main Content

Text Analytics Toolbox

텍스트 데이터 분석 및 모델링

Text Analytics Toolbox™는 텍스트 데이터를 전처리, 분석, 모델링하는 데 필요한 알고리즘과 시각화 기능을 제공합니다. 이 툴박스에서 만든 모델은 감성 분석, 예측 정비, 토픽 모델링 같은 다양한 응용 분야에 사용할 수 있습니다.

Text Analytics Toolbox에는 기기의 로그 데이터, 뉴스 피드, 설문 조사, 작업자 보고서, 소셜 미디어 같은 각종 소스의 원시 텍스트를 처리할 수 있는 다양한 툴이 들어 있습니다. 또한 널리 사용되는 형식의 파일에서 텍스트를 추출하고, 원시 텍스트를 전처리하고, 개별 단어를 추출하고, 텍스트를 숫자형 표현으로 변환하고, 통계 모델을 구축하는 등의 다양한 작업을 수행할 수 있습니다.

LSA, LDA, 단어 임베딩 같은 머신러닝 기법을 사용하여, 고차원 텍스트 데이터셋에서 군집을 찾고 특징을 생성할 수 있습니다. 또한 Text Analytics Toolbox에서 생성한 특징을 다른 데이터 소스의 특징과 결합해 텍스트, 숫자 등 다양한 유형의 데이터를 활용하는 머신러닝 모델을 구축할 수 있습니다.

Text Analytics Toolbox 시작하기

Text Analytics Toolbox의 기본 사항 배우기

텍스트 데이터 준비

MATLAB®으로 텍스트 데이터를 가져와 분석을 위해 전처리

모델링 및 예측

토픽 모델과 단어 임베딩을 사용하여 예측 모델 개발

표시 및 표현

워드 클라우드와 텍스트 산점도 플롯을 사용하여 텍스트 데이터와 모델 시각화

언어 지원

Text Analytics Toolbox의 언어 지원에 대한 정보