Main Content

textanalytics.ja.mecabToLemma

일본어의 MeCab 출력값에서 표제어 추출

R2019b 이후

설명

MeCab-ipadic 사전에서 반환된 형식의 MeCab 출력값이 주어진 경우 lemmata = textanalytics.ja.mecabToLemma(words,info)는 표제어(정규화된 단어)을 추출합니다.

입력 인수

모두 축소

입력 토큰으로, string형 벡터로 지정됩니다.

데이터형: string

다음 필드를 포함하는 정보 구조체:

  • Featurewords와 동일한 크기의 토큰으로 구성된 string형 벡터(분할된 토큰 없이 MeCab 출력 라인을 ChaSen 형식으로 포함함).

  • PartOfSpeech – MeCab-ipadic 사전 내에서 품사 분류에 사용되는 숫자형 코드.

데이터형: struct

출력 인수

모두 축소

추출된 표제어로, words와 동일한 크기의 string형 벡터로 반환됩니다.

버전 내역

R2019b에 개발됨