Main Content

readWordEmbedding

파일에서 단어 임베딩 읽어오기

설명

예제

emb = readWordEmbedding(filename)은 텍스트 파일 또는 zip 파일 filename에 저장되어 있는 사전 훈련된 단어 임베딩을 읽어옵니다. 입력 파일은 UTF-8로 인코딩된 word2vec 또는 GloVe 텍스트 임베딩 형식의 텍스트 파일이거나, 이 형식의 텍스트 파일이 포함된 zip 파일이어야 합니다.

단어 임베딩 파일에 중복된 단어가 들어 있으면 마지막 중복 항목에 해당하는 단어 벡터가 사용됩니다.

예제

모두 축소

예제 단어 임베딩을 읽어옵니다. 이 모델은 Wikipedia의 텍스트를 분석하여 도출되었습니다.

filename = "exampleWordEmbedding.vec";
emb = readWordEmbedding(filename)
emb = 
  wordEmbedding with properties:

     Dimension: 50
    Vocabulary: ["utc"    "first"    "new"    "two"    "time"    ...    ]

word2vecvec2word를 사용하여 단어 임베딩을 탐색합니다.

king = word2vec(emb,"king");
man = word2vec(emb,"man");
woman = word2vec(emb,"woman");
word = vec2word(emb,king - man + woman)
word = 
"queen"

입력 인수

모두 축소

파일 이름으로, string형 스칼라 또는 문자형 벡터로 지정됩니다.

데이터형: string | char

출력 인수

모두 축소

출력 단어 임베딩으로, wordEmbedding 객체로 반환됩니다.

버전 내역

R2017b에 개발됨