Main Content

언어 지원

Text Analytics Toolbox™의 언어 지원에 대한 정보

Text Analytics Toolbox는 한국어, 영어, 일본어, 독일어를 지원합니다. 대부분의 Text Analytics Toolbox 함수는 그 외 다른 언어의 텍스트에서도 작동합니다. 자세한 내용은 언어 고려 사항 항목을 참조하십시오.

함수

모두 확장

tokenizedDocument텍스트 분석에 사용되는 토큰화된 문서로 구성된 배열
removeStopWords문서에서 불용어 제거
normalizeWords단어의 어간 또는 표제어 추출
stopWords불용어 목록
mecabOptionsMeCab 토큰화 옵션 (R2019b 이후)
tokenDetails토큰화된 문서 배열 내 토큰의 세부 정보
addSentenceDetails문서에 문장 번호 추가
addPartOfSpeechDetails문서에 품사 태그 추가
addEntityDetails문서에 엔터티 태그 추가
addLemmaDetails문서에 토큰의 표제어 형태 추가
addLanguageDetails문서에 언어 식별자 추가
corpusLanguage텍스트의 언어 검출

도움말 항목

영어

  • 텍스트 데이터 준비
    MATLAB®으로 텍스트 데이터를 가져와 분석을 위해 전처리
  • 모델링 및 예측
    토픽 모델과 단어 임베딩을 사용하여 예측 모델 개발
  • 표시 및 표현
    워드 클라우드와 텍스트 산점도 플롯을 사용하여 텍스트 데이터와 모델 시각화

일본어

독일어

한국어

기타 언어