Main Content

isVocabularyWord

단어가 단어 임베딩 또는 인코딩에 포함되었는지 테스트

설명

tf = isVocabularyWord(emb,words)words의 요소가 단어 임베딩 emb에 포함되어 있는지 테스트합니다. 이 함수는 단어가 단어 임베딩에 포함되어 있는 경우 1(true)을 포함하는 논리형 배열을 반환합니다. 그렇지 않으면 이 배열은 0(false)을 포함합니다. 이 함수는 기본적으로 대/소문자를 구분합니다.

예제

tf = isVocabularyWord(enc,words)words의 요소가 단어 인코딩 enc에 포함되어 있는지 테스트합니다. 이 함수는 기본적으로 대/소문자를 구분합니다.

tf = isVocabularyWord(___,'IgnoreCase',true)는 위에 열거된 구문 중 하나를 사용하여 대/소문자를 무시한 경우 지정된 단어가 단어집에 있는지 테스트합니다.

예제

모두 축소

단어가 단어 임베딩에 포함되었는지 확인하기 위해 테스트합니다.

fastTextWordEmbedding 함수를 사용하여 사전 훈련된 단어 임베딩을 불러옵니다. 이 함수를 사용하려면 Text Analytics Toolbox™ Model for fastText English 16 Billion Token Word Embedding 지원 패키지가 필요합니다. 이 지원 패키지가 설치되어 있지 않으면 함수에서 다운로드 링크를 제공합니다.

emb = fastTextWordEmbedding
emb = 
  wordEmbedding with properties:

     Dimension: 300
    Vocabulary: [1×999994 string]

단어 "I", "love", "fastTextWordEmbedding"이 단어 임베딩에 있는지 테스트합니다.

words = ["I" "love" "fastTextWordEmbedding"];
tf = isVocabularyWord(emb,words)
tf = 1×3 logical array

   1   1   0

입력 인수

모두 축소

입력 단어 임베딩으로, wordEmbedding 객체로 지정됩니다.

입력 단어 인코딩으로, wordEncoding 객체로 지정됩니다.

입력 단어로, string형 벡터, 문자형 벡터 또는 문자형 벡터로 구성된 셀형 배열로 지정됩니다. words를 문자형 벡터로 지정할 경우 이 함수는 인수를 단일 단어로 처리합니다.

데이터형: string | char | cell

버전 내역

R2018b에 개발됨