MATLAB 도움말 센터
단어 임베딩 파일 쓰기
writeWordEmbedding(emb,filename)
writeWordEmbedding(emb,filename)는 단어 임베딩 emb를 filename 파일에 씁니다. 이 함수는 word2vec 텍스트 형식에 UTF-8로 된 단어집을 씁니다.
emb
filename
예제
모두 축소
단어 임베딩을 훈련시키고 텍스트 파일에 씁니다.
예제 데이터를 불러옵니다. 파일 sonnetsPreprocessed.txt에는 셰익스피어 소네트의 전처리된 버전이 들어 있습니다. 파일에는 한 줄에 하나씩 소네트가 들어 있으며 단어가 공백으로 구분되어 있습니다. sonnetsPreprocessed.txt에서 텍스트를 추출하고, 추출한 텍스트를 새 줄 문자에서 문서로 분할한 후 그 문서를 토큰화합니다.
sonnetsPreprocessed.txt
filename = "sonnetsPreprocessed.txt"; str = extractFileText(filename); textData = split(str,newline); documents = tokenizedDocument(textData);
trainWordEmbedding을 사용하여 단어 임베딩을 훈련시킵니다.
trainWordEmbedding
emb = trainWordEmbedding(documents)
Training: 100% Loss: 3.09928 Remaining time: 0 hours 0 minutes.
emb = wordEmbedding with properties: Dimension: 100 Vocabulary: ["thy" "thou" "love" "thee" "doth" "mine" "shall" "eyes" "sweet" "time" "nor" "beauty" "yet" "art" "heart" "o" "thine" "hath" "fair" "make" "still" … ] (1×401 string)
단어 임베딩을 텍스트 파일에 씁니다.
filename = "exampleSonnetsEmbedding.vec"; writeWordEmbedding(emb,filename)
readWordEmbedding을 사용하여 단어 임베딩 파일을 읽어옵니다.
readWordEmbedding
emb = readWordEmbedding(filename)
wordEmbedding
입력 단어 임베딩으로, wordEmbedding 객체로 지정됩니다.
파일 이름으로, string형 스칼라, 문자형 벡터 또는 문자형 벡터를 포함하는 1×1 셀형 배열로 지정됩니다.
데이터형: string | char | cell
string
char
cell
R2017b에 개발됨
fastTextWordEmbedding | doc2sequence | wordEmbeddingLayer | wordEncoding | word2vec | vec2word | readWordEmbedding | trainWordEmbedding | wordEmbedding | tokenizedDocument
fastTextWordEmbedding
doc2sequence
wordEmbeddingLayer
wordEncoding
word2vec
vec2word
tokenizedDocument
You clicked a link that corresponds to this MATLAB command:
Run the command by entering it in the MATLAB Command Window. Web browsers do not support MATLAB commands.
웹사이트 선택
번역된 콘텐츠를 보고 지역별 이벤트와 혜택을 살펴보려면 웹사이트를 선택하십시오. 현재 계신 지역에 따라 다음 웹사이트를 권장합니다:
또한 다음 목록에서 웹사이트를 선택하실 수도 있습니다.
사이트 성능 최적화 방법
최고의 사이트 성능을 위해 중국 사이트(중국어 또는 영어)를 선택하십시오. 현재 계신 지역에서는 다른 국가의 MathWorks 사이트 방문이 최적화되지 않았습니다.
미주
유럽
아시아 태평양
지역별 지사에 문의