Main Content

readWordEmbedding

파일에서 단어 임베딩 읽어오기

설명

예제

emb = readWordEmbedding(filename)은 텍스트 파일 또는 zip 파일 filename에 저장되어 있는 사전 훈련된 단어 임베딩을 읽어옵니다. 입력 파일은 UTF-8로 인코딩된 word2vec 또는 GloVe 텍스트 임베딩 형식의 텍스트 파일이거나, 이 형식의 텍스트 파일이 포함된 zip 파일이어야 합니다.

단어 임베딩 파일에 중복된 단어가 들어 있으면 마지막 중복 항목에 해당하는 단어 벡터가 사용됩니다.

예제

모두 축소

예제 단어 임베딩을 읽어옵니다. 이 모델은 Wikipedia의 텍스트를 분석하여 도출되었습니다.

filename = "exampleWordEmbedding.vec";
emb = readWordEmbedding(filename)
emb = 
  wordEmbedding with properties:

     Dimension: 50
    Vocabulary: ["utc"    "first"    "new"    "two"    "time"    "up"    "school"    "article"    "world"    "years"    "university"    "talk"    "many"    "national"    "later"    "state"    "made"    "born"    "city"    "de"    ...    ] (1x9999 string)

word2vecvec2word를 사용하여 단어 임베딩을 탐색합니다.

king = word2vec(emb,"king");
man = word2vec(emb,"man");
woman = word2vec(emb,"woman");
word = vec2word(emb,king - man + woman)
word = 
"queen"

입력 인수

모두 축소

파일 이름으로, string형 스칼라, 문자형 벡터 또는 문자형 벡터를 포함하는 1×1 셀형 배열로 지정됩니다.

데이터형: string | char | cell

출력 인수

모두 축소

출력 단어 임베딩으로, wordEmbedding 객체로 반환됩니다.

버전 내역

R2017b에 개발됨