언어에 독립적인 기능
단어 및 N-Gram 개수 세기
bagOfWords
함수와 bagOfNgrams
함수는 언어에 관계없이 tokenizedDocument
입력값을 지원합니다. 데이터가 포함된 tokenizedDocument
배열이 있는 경우 이러한 함수를 사용할 수 있습니다.
모델링 및 예측
fitlda
함수와 fitlsa
함수는 언어에 관계없이 bagOfWords
입력값과 bagOfNgrams
입력값을 지원합니다. 데이터가 포함된 bagOfWords
객체 또는 bagOfNgrams
객체가 있는 경우 이러한 함수를 사용할 수 있습니다.
trainWordEmbedding
함수는 언어에 관계없이 tokenizedDocument
또는 파일 입력값을 지원합니다. 올바른 형식의 데이터가 포함된 tokenizedDocument
배열 또는 파일이 있는 경우 이 함수를 사용할 수 있습니다.
참고 항목
stopWords
| removeWords
| normalizeWords
| bagOfWords
| bagOfNgrams
| tokenizedDocument
| fitlda
| fitlsa
| wordcloud
| addSentenceDetails
| addLanguageDetails