Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

vec2word

임베딩 벡터를 단어에 매핑

설명

예제

words = vec2word(emb,M)M의 행의 임베딩 벡터에 가장 가까운 단어를 반환합니다.

예제

[words,dist] = vec2word(emb,M)M의 임베딩 벡터에 가장 가까운 단어를 반환하고 해당 소스 벡터까지의 각 거리 dist를 반환합니다.

예제

___ = vec2word(emb,M,k)는 상위 k개의 가장 가까운 단어를 반환합니다.

예제

___ = vec2word(___,'Distance',distance)는 거리 측정법을 지정합니다.

예제

모두 축소

사전 훈련된 단어 임베딩을 fastTextWordEmbedding을 사용하여 불러옵니다. 이 함수를 사용하려면 Text Analytics Toolbox™ Model for fastText English 16 Billion Token Word Embedding 지원 패키지가 필요합니다. 이 지원 패키지가 설치되어 있지 않으면 함수에서 다운로드 링크를 제공합니다.

emb = fastTextWordEmbedding
emb = 
  wordEmbedding with properties:

     Dimension: 300
    Vocabulary: [1×1000000 string]

word2vec을 사용하여 단어 "Italy", "Rome" 및 "Paris"를 벡터에 매핑합니다.

italy = word2vec(emb,"Italy");
rome = word2vec(emb,"Rome");
paris = word2vec(emb,"Paris");

vec2word를 사용하여 벡터 italy - rome + paris를 단어에 매핑합니다.

word = vec2word(emb,italy - rome + paris)
word = 
"France"

단어 임베딩 벡터에 가장 가까운 상위 5개 단어와 해당 거리를 찾습니다.

사전 훈련된 단어 임베딩을 fastTextWordEmbedding을 사용하여 불러옵니다. 이 함수를 사용하려면 Text Analytics Toolbox™ Model for fastText English 16 Billion Token Word Embedding 지원 패키지가 필요합니다. 이 지원 패키지가 설치되어 있지 않으면 함수에서 다운로드 링크를 제공합니다.

emb = fastTextWordEmbedding;

word2vec을 사용하여 단어 "Italy", "Rome" 및 "Paris"를 벡터에 매핑합니다.

italy = word2vec(emb,"Italy");
rome = word2vec(emb,"Rome");
paris = word2vec(emb,"Paris");

vec2word를 사용하여 벡터 italy - rome + paris를 단어에 매핑합니다. 유클리드 거리 측정법을 사용하여 가장 가까운 상위 5개 단어를 찾습니다.

k = 5;
M = italy - rome + paris;
[words,dist] = vec2word(emb,M,k,'Distance','euclidean');

단어와 거리를 막대 차트에 플로팅합니다.

figure;
bar(dist)
xticklabels(words)
xlabel("Word")
ylabel("Distance")
title("Distances to Vector")

입력 인수

모두 축소

입력 단어 임베딩으로, wordEmbedding 객체로 지정됩니다.

단어 임베딩 벡터로, 행렬로 지정됩니다. M의 각 행은 단어 임베딩 벡터입니다. M에는 emb.Dimension개의 열이 있어야 합니다.

반환할 가장 가까운 단어의 개수로, 양의 정수로 지정됩니다.

거리 측정법으로, 'cosine' 또는 'euclidean'으로 지정됩니다.

출력 인수

모두 축소

출력 단어로, string형 벡터로 반환됩니다.

단어에서 소스 벡터까지의 거리로, 벡터로 반환됩니다.

버전 내역

R2017b에 개발됨