readWordEmbedding

파일에서 단어 임베딩 읽어오기

구문

emb = readWordEmbedding(filename)

설명

emb = readWordEmbedding(filename)은 텍스트 파일 또는 zip 파일 filename에 저장되어 있는 사전 훈련된 단어 임베딩을 읽어옵니다. 입력 파일은 UTF-8로 인코딩된 word2vec 또는 GloVe 텍스트 임베딩 형식의 텍스트 파일이거나, 이 형식의 텍스트 파일이 포함된 zip 파일이어야 합니다.

단어 임베딩 파일에 중복된 단어가 들어 있으면 마지막 중복 항목에 해당하는 단어 벡터가 사용됩니다.

예제

모두 축소

텍스트 파일에서 단어 임베딩 읽어오기

라이브 스크립트 열기

예제 단어 임베딩을 읽어옵니다. 이 모델은 Wikipedia의 텍스트를 분석하여 도출되었습니다.

filename = "exampleWordEmbedding.vec";
emb = readWordEmbedding(filename)

emb = 
  wordEmbedding with properties:

     Dimension: 50
    Vocabulary: ["utc"    "first"    "new"    "two"    "time"    "up"    "school"    "article"    "world"    "years"    "university"    "talk"    "many"    "national"    "later"    "state"    "made"    "born"    "city"    "de"    …    ] (1×9999 string)

word2vec 및 vec2word를 사용하여 단어 임베딩을 탐색합니다.

king = word2vec(emb,"king");
man = word2vec(emb,"man");
woman = word2vec(emb,"woman");
word = vec2word(emb,king - man + woman)

word = 
"queen"

입력 인수

모두 축소

`filename` — 파일 이름
string형 스칼라 | 문자형 벡터 | 문자형 벡터를 포함하는 1×1 셀형 배열

파일 이름으로, string형 스칼라, 문자형 벡터 또는 문자형 벡터를 포함하는 1×1 셀형 배열로 지정됩니다.

데이터형: string | char | cell

출력 인수

모두 축소

`emb` — 출력 단어 임베딩
단어 임베딩

출력 단어 임베딩으로, wordEmbedding 객체로 반환됩니다.

버전 내역

R2017b에 개발됨

참고 항목

readWordEmbedding

구문

설명

예제

텍스트 파일에서 단어 임베딩 읽어오기

입력 인수

filename — 파일 이름 string형 스칼라 | 문자형 벡터 | 문자형 벡터를 포함하는 1×1 셀형 배열

출력 인수

emb — 출력 단어 임베딩 단어 임베딩

버전 내역

참고 항목

도움말 항목

`filename` — 파일 이름
string형 스칼라 | 문자형 벡터 | 문자형 벡터를 포함하는 1×1 셀형 배열

`emb` — 출력 단어 임베딩
단어 임베딩