Main Content

textanalytics.ja.mecabToNER

일본어의 MeCab 출력값에서 명명된 엔터티 정보 추출

R2019b 이후

설명

MeCab-ipadic 사전에서 반환된 형식의 MeCab 출력값이 주어진 경우 entities = textanalytics.ja.mecabToNER(words,info)는 명명된 엔터티 정보를 추출합니다.

입력 인수

모두 축소

입력 토큰으로, string형 벡터로 지정됩니다.

데이터형: string

다음 필드를 포함하는 정보 구조체:

  • Featurewords와 동일한 크기의 토큰으로 구성된 string형 벡터(분할된 토큰 없이 MeCab 출력 라인을 ChaSen 형식으로 포함함).

  • PartOfSpeech – MeCab-ipadic 사전 내에서 품사 분류에 사용되는 숫자형 코드.

데이터형: struct

출력 인수

모두 축소

추출된 엔터티 정보로, words와 동일한 크기의 categorical형 벡터로 반환됩니다.

버전 내역

R2019b에 개발됨