이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.
모델링 및 예측
토픽 모델과 단어 임베딩을 사용하여 예측 모델 개발
LSA, LDA, 단어 임베딩 같은 머신러닝 기법과 모델을 사용하여 고차원 텍스트 데이터셋에서 군집을 찾고 특징을 추출할 수 있습니다. Text Analytics Toolbox™에서 생성한 특징은 다른 데이터 소스의 특징과 결합할 수 있습니다. 결합된 특징을 사용하여 텍스트, 숫자 등 다양한 유형의 데이터를 활용하는 머신러닝 모델을 빌드할 수 있습니다.
함수
도움말 항목
분류 및 모델링
- 단순 전처리 함수 만들기
이 예제에서는 분석할 텍스트 데이터를 정리하고 전처리하는 함수를 만드는 방법을 보여줍니다. - 분류를 위한 간단한 텍스트 모델 만들기
이 예제에서는 bag-of-words 모델을 사용하여 단어 빈도 수로 간단한 텍스트 분류기를 훈련시키는 방법을 보여줍니다. - Classify Documents Using Document Embeddings
This example shows how to train a document classifier by converting documents to feature vectors using word embeddings. - 다단어 구문을 사용하여 텍스트 데이터 분석하기
이 예제에서는 n-gram 빈도 수를 사용하여 텍스트를 분석하는 방법을 보여줍니다. - 토픽 모델을 사용하여 텍스트 데이터 분석하기
이 예제에서는 LDA(잠재 디리클레 할당) 토픽 모델을 사용하여 텍스트 데이터를 분석하는 방법을 보여줍니다. - LDA 모델의 토픽 수 선택하기
이 예제에서는 LDA(잠재 디리클레 할당) 모델에 적합한 토픽 수를 결정하는 방법을 보여줍니다. - Compare LDA Solvers
This example shows how to compare latent Dirichlet allocation (LDA) solvers by comparing the goodness of fit and the time taken to fit the model. - LDA 모델을 사용하여 문서 군집 시각화하기
이 예제에서는 LDA(잠재 디리클레 할당) 토픽 모델과 t-SNE 플롯을 사용하여 문서 군집을 시각화하는 방법을 보여줍니다. - LDA 토픽 상관 시각화하기
이 예제에서는 LDA(잠재 디리클레 할당) 토픽 모델에서 토픽 사이의 상관을 분석하는 방법을 보여줍니다. - LDA 토픽과 문서 레이블 간의 상관 시각화하기
이 예제에서는 LDA(잠재 디리클레 할당) 토픽 모델을 피팅하고 LDA 토픽과 문서 레이블 간의 상관을 시각화하는 방법을 보여줍니다. - 동시발생 신경망 만들기
이 예제에서는 bag-of-words 모델을 사용하여 동시발생 신경망을 만드는 방법을 보여줍니다.
감성 분석 및 키워드 추출
- 텍스트에 내포된 감성 분석하기
이 예제에서는 VADER(Valence Aware Dictionary and sEntiment Reasoner) 알고리즘을 사용하여 감성 분석을 수행하는 방법을 보여줍니다. - Generate Domain Specific Sentiment Lexicon
This example shows how to generate a lexicon for sentiment analysis using 10-K and 10-Q financial reports. - 감성 분류기 훈련시키기
이 예제에서는 주석이 있는 긍정적, 부정적 감성 단어 목록과 사전 훈련된 단어 임베딩을 사용하여 분류기에게 감성 분석을 훈련시키는 방법을 보여줍니다. - Extract Keywords from Text Data Using RAKE
This example shows how to extract keywords from text data using Rapid Automatic Keyword Extraction (RAKE). - TextRank를 사용하여 텍스트 데이터에서 키워드 추출하기
이 예제는 TextRank를 사용하여 텍스트 데이터에서 키워드를 추출하는 방법을 보여줍니다.
딥러닝
- 딥러닝을 사용하여 텍스트 데이터 분류하기
이 예제에서는 딥러닝 장단기 기억(LSTM) 신경망을 사용하여 텍스트 데이터를 분류하는 방법을 보여줍니다. - Classify Text Data Using Convolutional Neural Network
This example shows how to classify text data using a convolutional neural network. - Classify Out-of-Memory Text Data Using Deep Learning
This example shows how to classify out-of-memory text data with a deep learning network using a transformed datastore. - Sequence-to-Sequence Translation Using Attention
This example shows how to convert decimal strings to Roman numerals using a recurrent sequence-to-sequence encoder-decoder model with attention. - Multilabel Text Classification Using Deep Learning
This example shows how to classify text data that has multiple independent labels. - 딥러닝을 사용하여 텍스트 생성하기 (Deep Learning Toolbox)
이 예제에서는 텍스트를 생성하도록 딥러닝 장단기 기억(LSTM) 신경망을 훈련시키는 방법을 보여줍니다. - 오만과 편견 그리고 MATLAB
이 예제에서는 문자 임베딩을 사용하여 텍스트를 생성하도록 딥러닝 LSTM 신경망을 훈련시키는 방법을 보여줍니다. - 딥러닝을 사용하여 단어 단위로 텍스트 생성하기
이 예제에서는 단어 단위로 텍스트를 생성하도록 딥러닝 LSTM 신경망을 훈련시키는 방법을 보여줍니다. - Classify Text Data Using Custom Training Loop
This example shows how to classify text data using a deep learning bidirectional long short-term memory (BiLSTM) network with a custom training loop. - Generate Text Using Autoencoders
This example shows how to generate text data using autoencoders. - Define Text Encoder Model Function
This example shows how to define a text encoder model function. - 텍스트 디코더 모델 함수 정의하기
이 예제에서는 텍스트 디코더 모델 함수를 정의하는 방법을 보여줍니다. - Language Translation Using Deep Learning
This example shows how to train a German to English language translator using a recurrent sequence-to-sequence encoder-decoder model with attention.
언어 지원
- 언어 고려 사항
다른 언어에서 Text Analytics Toolbox 기능을 사용하는 방법에 대한 정보. - 일본어 지원
Text Analytics Toolbox의 일본어 지원에 대한 정보. - Analyze Japanese Text Data
This example shows how to import, prepare, and analyze Japanese text data using a topic model. - 독일어 지원
Text Analytics Toolbox의 독일어 지원에 대한 정보. - Analyze German Text Data
This example shows how to import, prepare, and analyze German text data using a topic model.