문서 간 유사도를 구하는 세 가지 방법이 있다. 다른 방법들도 많지만 이해하기 쉬운 세 가지만 찾아보았다.
설명이 잘 나온 블로그가 아래 있어서 기록.
1) 유클리드 유사도
https://heytech.tistory.com/357
2) 코사인 유사도
https://heytech.tistory.com/356
3) 자카드 유사도
https://heytech.tistory.com/358
728x90
반응형
'개발' 카테고리의 다른 글
선형패턴화 (0) | 2022.11.21 |
---|---|
퍼셉트론은 선형분류기, 다층퍼셉트론은 비선형분류기 (0) | 2022.11.21 |
CountVectorizer 를 이용해서 문서에 나온 단어 빈도수 뽑아보기 (0) | 2022.11.19 |
2022.11.17 특강 (0) | 2022.11.17 |
텍스트 마이닝 총정리 (0) | 2022.11.16 |