abbreviations

일반 약어 테이블

구문

tbl = abbreviations

tbl = abbreviations('Language',language)

설명

"appt.", "Dr.", "fig." 같이 마침표가 들어 있는 약어는 문장 검출에 영향을 미칩니다. addSentenceDetails 함수 및 addPartOfSpeechDetails 함수는 약어 테이블을 사용하여 문장 경계를 검출합니다. abbreviations 함수는 이러한 함수에서 사용하는 디폴트 테이블을 출력합니다. 이 테이블을 사용하면 문장 검출 동작을 지정하는 데 쓰이는 사용자 지정 약어 테이블을 손쉽게 만들 수 있습니다.

이 함수는 한국어, 영어, 일본어, 독일어를 지원합니다. 한국어와 일본어 약어 목록은 비어 있습니다. 이 두 언어의 경우 약어가 일반적으로 문장 검출에 영향을 주지 않기 때문입니다.

tbl = abbreviations는 영어로 된 일반 약어 테이블을 반환합니다.

예제

tbl = abbreviations('Language',language)는 약어 언어를 지정합니다.

예제

모두 축소

약어 테이블

라이브 스크립트 열기

약어 테이블을 표시합니다. addSentenceDetails를 사용할 때 이 테이블을 사용해 약어와 문장을 검출할 수 있습니다.

tbl = abbreviations;
head(tbl)

    Abbreviation     Usage 
    ____________    _______

       "ATS"        regular
       "Ao"         regular
       "BEF"        regular
       "Ba"         regular
       "Bd"         regular
       "Bi"         regular
       "Bq"         regular
       "Cent"       regular

독일어 약어 테이블

라이브 스크립트 열기

독일어 약어 테이블을 표시합니다. addSentenceDetails를 사용할 때 이 테이블을 사용해 문장 검출을 위한 사용자 지정 약어 테이블을 손쉽게 만들 수 있습니다.

tbl = abbreviations('Language','de');
head(tbl)

    Abbreviation     Usage 
    ____________    _______

       "A.T"        regular
       "ABl"        regular
       "Abb"        regular
       "Abdr"       regular
       "Abf"        regular
       "Abfl"       regular
       "Abh"        regular
       "Abk"        regular

입력 인수

모두 축소

`language` — 약어 언어
`'en'` (디폴트 값) | `'ja'` | `'de'` | `'ko'`

약어 언어로, 다음 중 하나로 지정됩니다.

'en' – 영어
'ja' – 일본어
'de' – 독일어
'ko' – 한국어

'ja' 또는 'ko'를 지정할 경우 이 함수는 빈 테이블을 반환합니다. Text Analytics Toolbox™의 언어 지원에 대한 자세한 내용은 언어 고려 사항 항목을 참조하십시오.

출력 인수

모두 축소

`tbl` — 약어 테이블
테이블

약어 테이블. 기본적으로 addSentenceDetails 함수 및 splitSentences 함수는 이 테이블을 사용하여 문장 경계를 검출합니다. 이 테이블에는 주로 마침표를 넣어 작성한 약어만 포함되어 있습니다.

이 테이블에는 두 개의 변수가 들어 있습니다.

Abbreviation – 약어로, string형으로 지정됩니다.
Usage – 약어의 유형으로, categorical형 스칼라로 지정됩니다.

다음 표에는 다음 유형의 약어가 발견될 경우에 Usage가 가질 수 있는 값과 addSentenceDetails 및 splitSentences의 동작이 설명되어 있습니다.

사용법	동작	예제 약어	예제 텍스트	검출된 문장
`regular`	다음 단어가 대문자로 된 문장 시작 부분인 경우 후행 마침표에서 문장을 나눕니다. 그 외의 경우에는 후행 마침표에서 문장을 나누지 않습니다.	"appt."	`"Book an appt. We'll meet then."`	`"Book an appt."` `"We'll meet then."`
`regular`		"appt."	`"Book an appt. today."`	`"Book an appt. today."`
`inner`	후행 마침표 다음에서 문장을 나누지 않습니다.	"Dr."	`"Dr. Smith."`	`"Dr. Smith."`
`reference`	다음 토큰이 숫자가 아니면 후행 마침표에서 문장을 나눕니다. 다음 토큰이 숫자이면 후행 마침표에서 문장을 나누지 않습니다.	"fig."	`"See fig. 3."`	`"See fig. 3."`
`reference`		"fig."	`"Try a fig. They are nice."`	`"Try a fig."` `"They are nice."`
`unit`	앞 단어가 숫자이고 다음 단어가 대문자로 된 문장 시작 부분이면 후행 마침표에서 문장을 나눕니다.	"in."	`"The height is 30 in. The width is 10 in."`	`"The height is 30 in."` `"The width is 10 in."`
	앞 단어가 숫자이고 다음 단어가 대문자가 아니면 후행 마침표에서 문장을 나누지 않습니다.		`"The item is 10 in. wide."`	`"The item is 10 in. wide."`
	앞 단어가 숫자가 아니면 후행 마침표에서 문장을 나눕니다.		`"Come in. Sit down."`	`"Come in."` `"Sit down."`

한국어와 일본어 약어 목록은 비어 있습니다. 이 두 언어의 경우 대개 약어가 문장 검출에 영향을 주지 않기 때문입니다.

버전 내역

R2018a에 개발됨

참고 항목

tokenDetails | addSentenceDetails | addPartOfSpeechDetails | tokenizedDocument

abbreviations

구문

설명

예제

약어 테이블

독일어 약어 테이블

입력 인수

language — 약어 언어 'en' (디폴트 값) | 'ja' | 'de' | 'ko'

출력 인수

tbl — 약어 테이블 테이블

버전 내역

참고 항목

도움말 항목

`language` — 약어 언어
`'en'` (디폴트 값) | `'ja'` | `'de'` | `'ko'`

`tbl` — 약어 테이블
테이블