cosineSimilarity
코사인 유사도를 사용한 문서 유사도
구문
설명
는 단어 개수에서 파생된 TF-IDF 행렬을 사용하여 지정된 문서의 쌍별 코사인 유사도를 반환합니다. similarities = cosineSimilarity(documents)similarities(i,j)의 점수는 documents(i)와 documents(j) 사이의 유사도를 나타냅니다.
는 similarities = cosineSimilarity(documents,queries)documents의 단어 개수에서 도출된 TF-IDF 행렬을 사용하여 documents와 queries 사이의 유사도를 반환합니다. similarities(i,j)의 점수는 documents(i)와 queries(j) 사이의 유사도를 나타냅니다.
은 similarities = cosineSimilarity(bag)bag의 단어 개수에서 도출된 TF-IDF 행렬을 사용하여 지정된 bag-of-words 또는 bag-of-n-grams 모델에 의해 인코딩된 문서의 쌍별 유사도를 반환합니다. similarities(i,j)의 점수는 bag에 의해 인코딩된 i번째 문서와 j번째 문서 사이의 유사도를 나타냅니다.
는 similarities = cosineSimilarity(bag,queries)bag의 단어 개수에서 도출된 TF-IDF 행렬을 사용하여 bag-of-words 또는 bag-of-n-grams 모델 bag에 의해 인코딩된 문서와 queries 사이의 유사도를 반환합니다. similarities(i,j)의 점수는 bag에 의해 인코딩된 i번째 문서와 queries(j) 사이의 유사도를 나타냅니다.
은 행렬 similarities = cosineSimilarity(M)M 의 행 벡터로 인코딩된 데이터에 대한 유사도를 반환합니다. similarities(i,j)의 점수는 M(i,:)과 M(j,:) 사이의 유사도를 나타냅니다.
는 행렬 similarities = cosineSimilarity(M1,M2)M1 및 M2의 인코딩된 문서 사이의 유사도를 반환합니다. similarities(i,j)의 점수는 M1(i,:)과 M2(j,:) 사이의 유사도에 대응합니다.



