Text Analytics Toolbox 시작하기
Text Analytics Toolbox™는 텍스트 데이터를 전처리, 분석, 모델링하는 데 필요한 알고리즘과 시각화 기능을 제공합니다. 이 툴박스에서 만든 모델은 감성 분석, 예측 정비, 토픽 모델링 같은 다양한 응용 분야에 사용할 수 있습니다.
Text Analytics Toolbox에는 기기의 로그 데이터, 뉴스 피드, 설문 조사, 작업자 보고서, 소셜 미디어 같은 각종 소스의 원시 텍스트를 처리할 수 있는 다양한 툴이 들어 있습니다. 또한 널리 사용되는 형식의 파일에서 텍스트를 추출하고, 원시 텍스트를 전처리하고, 개별 단어를 추출하고, 텍스트를 숫자형 표현으로 변환하고, 통계 모델을 구축하는 등의 다양한 작업을 수행할 수 있습니다.
LSA, LDA, 단어 임베딩 같은 머신러닝 기법을 사용하여, 고차원 텍스트 데이터셋에서 군집을 찾고 특징을 생성할 수 있습니다. 또한 Text Analytics Toolbox에서 생성한 특징을 다른 데이터 소스의 특징과 결합해 텍스트, 숫자 등 다양한 유형의 데이터를 활용하는 머신러닝 모델을 구축할 수 있습니다.
튜토리얼
- 코드 10줄로 시작해 보는 텍스트 분석
이 예제에서는 MATLAB® 코드 단 10줄로 텍스트 분석을 사용해 텍스트 데이터를 분류하는 방법을 보여줍니다.
- MATLAB으로 텍스트 데이터 가져오기
다양한 소스에서 텍스트 데이터를 가져옵니다.
- 단순 전처리 함수 만들기
이 예제에서는 텍스트 데이터 전처리 라이브 편집기 작업을 사용하여 분석할 텍스트 데이터를 정리하고 전처리하는 함수를 만드는 방법을 보여줍니다.
- 토픽 모델링 시작하기
이 예제에서는 토픽 모델을 텍스트 데이터에 피팅하고 토픽을 시각화하는 방법을 보여줍니다.
- 워드 클라우드를 사용하여 텍스트 데이터 시각화하기
이 예제에서는 워드 클라우드를 사용하여 텍스트 데이터를 시각화하는 방법을 보여줍니다.