Main Content

abbreviations

일반 약어 테이블

설명

"appt.", "Dr.", "fig." 같이 마침표가 들어 있는 약어는 문장 검출에 영향을 미칩니다. addSentenceDetails 함수 및 addPartOfSpeechDetails 함수는 약어 테이블을 사용하여 문장 경계를 검출합니다. abbreviations 함수는 이러한 함수에서 사용하는 디폴트 테이블을 출력합니다. 이 테이블을 사용하면 문장 검출 동작을 지정하는 데 쓰이는 사용자 지정 약어 테이블을 손쉽게 만들 수 있습니다.

이 함수는 한국어, 영어, 일본어, 독일어를 지원합니다. 한국어와 일본어 약어 목록은 비어 있습니다. 이 두 언어의 경우 약어가 일반적으로 문장 검출에 영향을 주지 않기 때문입니다.

예제

tbl = abbreviations는 영어로 된 일반 약어 테이블을 반환합니다.

예제

tbl = abbreviations('Language',language)는 약어 언어를 지정합니다.

예제

모두 축소

약어 테이블을 표시합니다. addSentenceDetails를 사용할 때 이 테이블을 사용해 약어와 문장을 검출할 수 있습니다.

tbl = abbreviations;
head(tbl)
    Abbreviation     Usage 
    ____________    _______

       "ATS"        regular
       "Ao"         regular
       "BEF"        regular
       "Ba"         regular
       "Bd"         regular
       "Bi"         regular
       "Bq"         regular
       "Cent"       regular

독일어 약어 테이블을 표시합니다. addSentenceDetails를 사용할 때 이 테이블을 사용해 문장 검출을 위한 사용자 지정 약어 테이블을 손쉽게 만들 수 있습니다.

tbl = abbreviations('Language','de');
head(tbl)
    Abbreviation     Usage 
    ____________    _______

       "A.T"        regular
       "ABl"        regular
       "Abb"        regular
       "Abdr"       regular
       "Abf"        regular
       "Abfl"       regular
       "Abh"        regular
       "Abk"        regular

입력 인수

모두 축소

약어 언어로, 다음 중 하나로 지정됩니다.

  • 'en' – 영어

  • 'ja' – 일본어

  • 'de' – 독일어

  • 'ko' – 한국어

'ja' 또는 'ko'를 지정할 경우 이 함수는 빈 테이블을 반환합니다. Text Analytics Toolbox™의 언어 지원에 대한 자세한 내용은 언어 고려 사항 항목을 참조하십시오.

출력 인수

모두 축소

약어 테이블. 기본적으로 addSentenceDetails 함수 및 splitSentences 함수는 이 테이블을 사용하여 문장 경계를 검출합니다. 이 테이블에는 주로 마침표를 넣어 작성한 약어만 포함되어 있습니다.

이 테이블에는 두 개의 변수가 들어 있습니다.

  • Abbreviation – 약어로, string형으로 지정됩니다.

  • Usage – 약어의 유형으로, categorical형 스칼라로 지정됩니다.

다음 표에는 다음 유형의 약어가 발견될 경우에 Usage가 가질 수 있는 값과 addSentenceDetailssplitSentences의 동작이 설명되어 있습니다.

사용법동작예제 약어예제 텍스트검출된 문장
regular다음 단어가 대문자로 된 문장 시작 부분인 경우 후행 마침표에서 문장을 나눕니다. 그 외의 경우에는 후행 마침표에서 문장을 나누지 않습니다."appt.""Book an appt. We'll meet then."

"Book an appt."

"We'll meet then."

"Book an appt. today.""Book an appt. today."
inner후행 마침표 다음에서 문장을 나누지 않습니다."Dr.""Dr. Smith.""Dr. Smith."
reference다음 토큰이 숫자가 아니면 후행 마침표에서 문장을 나눕니다. 다음 토큰이 숫자이면 후행 마침표에서 문장을 나누지 않습니다."fig.""See fig. 3.""See fig. 3."
"Try a fig. They are nice."

"Try a fig."

"They are nice."

unit앞 단어가 숫자이고 다음 단어가 대문자로 된 문장 시작 부분이면 후행 마침표에서 문장을 나눕니다."in.""The height is 30 in. The width is 10 in."

"The height is 30 in."

"The width is 10 in."

앞 단어가 숫자이고 다음 단어가 대문자가 아니면 후행 마침표에서 문장을 나누지 않습니다."The item is 10 in. wide.""The item is 10 in. wide."
앞 단어가 숫자가 아니면 후행 마침표에서 문장을 나눕니다."Come in. Sit down."

"Come in."

"Sit down."

한국어와 일본어 약어 목록은 비어 있습니다. 이 두 언어의 경우 대개 약어가 문장 검출에 영향을 주지 않기 때문입니다.

버전 내역

R2018a에 개발됨