사전 훈련된 단어 임베딩을 fastTextWordEmbedding을 사용하여 불러옵니다. 이 함수를 사용하려면 Text Analytics Toolbox™ Model for fastText English 16 Billion Token Word Embedding 지원 패키지가 필요합니다. 이 지원 패키지가 설치되어 있지 않으면 함수에서 다운로드 링크를 제공합니다.
emb = fastTextWordEmbedding
emb =
wordEmbedding with properties:
Dimension: 300
Vocabulary: [1×1000000 string]
word2vec를 사용하여 처음 500개 단어를 벡터로 변환합니다. V는 길이가 300인 단어 벡터로 구성된 행렬입니다.
words = emb.Vocabulary(1:500);
V = word2vec(emb,words);
size(V)
ans = 1×2
500 300
tsne를 사용하여 2차원 공간에 단어 벡터를 임베딩합니다.
XY = tsne(V);
2-D 텍스트 산점도 플롯에서 XY에 의해 지정된 좌표에 단어를 플로팅합니다. 단어 색은 무작위로 지정되도록 합니다.