MATLAB 도움말 센터
파일에서 단어 임베딩 읽어오기
emb = readWordEmbedding(filename)
emb = readWordEmbedding(filename)은 텍스트 파일 또는 zip 파일 filename에 저장되어 있는 사전 훈련된 단어 임베딩을 읽어옵니다. 입력 파일은 UTF-8로 인코딩된 word2vec 또는 GloVe 텍스트 임베딩 형식의 텍스트 파일이거나, 이 형식의 텍스트 파일이 포함된 zip 파일이어야 합니다.
emb
filename
단어 임베딩 파일에 중복된 단어가 들어 있으면 마지막 중복 항목에 해당하는 단어 벡터가 사용됩니다.
예제
모두 축소
예제 단어 임베딩을 읽어옵니다. 이 모델은 Wikipedia의 텍스트를 분석하여 도출되었습니다.
filename = "exampleWordEmbedding.vec"; emb = readWordEmbedding(filename)
emb = wordEmbedding with properties: Dimension: 50 Vocabulary: ["utc" "first" "new" "two" "time" "up" "school" "article" "world" "years" "university" "talk" "many" "national" "later" "state" "made" "born" "city" "de" … ] (1×9999 string)
word2vec 및 vec2word를 사용하여 단어 임베딩을 탐색합니다.
word2vec
vec2word
king = word2vec(emb,"king"); man = word2vec(emb,"man"); woman = word2vec(emb,"woman"); word = vec2word(emb,king - man + woman)
word = "queen"
파일 이름으로, string형 스칼라, 문자형 벡터 또는 문자형 벡터를 포함하는 1×1 셀형 배열로 지정됩니다.
데이터형: string | char | cell
string
char
cell
출력 단어 임베딩으로, wordEmbedding 객체로 반환됩니다.
wordEmbedding
R2017b에 개발됨
fastTextWordEmbedding | doc2sequence | wordEmbeddingLayer | wordEncoding | word2vec | vec2word | trainWordEmbedding | writeWordEmbedding | wordEmbedding | tokenizedDocument
fastTextWordEmbedding
doc2sequence
wordEmbeddingLayer
wordEncoding
trainWordEmbedding
writeWordEmbedding
tokenizedDocument
You clicked a link that corresponds to this MATLAB command:
Run the command by entering it in the MATLAB Command Window. Web browsers do not support MATLAB commands.
웹사이트 선택
번역된 콘텐츠를 보고 지역별 이벤트와 혜택을 살펴보려면 웹사이트를 선택하십시오. 현재 계신 지역에 따라 다음 웹사이트를 권장합니다:
또한 다음 목록에서 웹사이트를 선택하실 수도 있습니다.
사이트 성능 최적화 방법
최고의 사이트 성능을 위해 중국 사이트(중국어 또는 영어)를 선택하십시오. 현재 계신 지역에서는 다른 국가의 MathWorks 사이트 방문이 최적화되지 않았습니다.
미주
유럽
아시아 태평양
지역별 지사에 문의