도움말 센터도움말 센터
일본어의 MeCab 출력값에서 표제어 추출
R2019b 이후
lemmata = textanalytics.ja.mecabToLemma(words,info)
MeCab-ipadic 사전에서 반환된 형식의 MeCab 출력값이 주어진 경우 lemmata = textanalytics.ja.mecabToLemma(words,info)는 표제어(정규화된 단어)을 추출합니다.
lemmata
words
info
모두 축소
입력 토큰으로, string형 벡터로 지정됩니다.
데이터형: string
string
다음 필드를 포함하는 정보 구조체:
Feature – words와 동일한 크기의 토큰으로 구성된 string형 벡터(분할된 토큰 없이 MeCab 출력 라인을 ChaSen 형식으로 포함함).
Feature
PartOfSpeech – MeCab-ipadic 사전 내에서 품사 분류에 사용되는 숫자형 코드.
PartOfSpeech
데이터형: struct
struct
추출된 표제어로, words와 동일한 크기의 string형 벡터로 반환됩니다.
R2019b에 개발됨
mecabOptions | tokenizedDocument | addLemmaDetails | normalizeWords | textanalytics.ja.mecabToPOS | textanalytics.ja.mecabToNER
mecabOptions
tokenizedDocument
addLemmaDetails
normalizeWords
textanalytics.ja.mecabToPOS
textanalytics.ja.mecabToNER
다음 MATLAB 명령에 해당하는 링크를 클릭했습니다.
명령을 실행하려면 MATLAB 명령 창에 입력하십시오. 웹 브라우저는 MATLAB 명령을 지원하지 않습니다.
Select a Web Site
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list:
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Contact your local office