removeStopWords
문서에서 불용어 제거
구문
설명
"a", "and", "to", "the" 같은 단어(불용어라고 함)는 데이터에 잡음을 추가할 수 있습니다. 분석 전에 이 함수를 사용하여 불용어를 제거하십시오.
이 함수는 한국어, 영어, 일본어, 독일어 텍스트를 지원합니다. 다른 언어에서 removeStopWords
함수를 사용하는 방법을 알아보려면 언어 고려 사항 항목을 참조하십시오.
는 newDocuments
= removeStopWords(documents
)tokenizedDocument
배열 documents
에서 불용어를 제거합니다. 기본적으로 이 함수는 documents
의 언어 세부 정보에 따라 stopWords
함수에서 제공된 불용어 목록을 사용하며 대/소문자를 구분하지 않습니다.
사용자 지정 단어 목록을 제거하려면 removeWords
함수를 사용합니다.
는 newDocuments
= removeStopWords(documents
,'IgnoreCase',false)stopWords
함수에 의해 지정된 불용어 목록과 대/소문자가 일치하는 불용어를 제거합니다.
팁
removeStopWords
함수는 normalizeWords
함수에 의해 제거되는 정보를 사용하므로 이 함수를 사용하기 전에 removeStopWords
함수를 사용해야 합니다.
예제
입력 인수
출력 인수
세부 정보
알고리즘
버전 내역
R2018b에 개발됨