문서 간 유사도를 구하는 3가지 방법

2022. 11. 19. 11:04· 개발

문서 간 유사도를 구하는 세 가지 방법이 있다. 다른 방법들도 많지만 이해하기 쉬운 세 가지만 찾아보았다.

설명이 잘 나온 블로그가 아래 있어서 기록.

1) 유클리드 유사도

https://heytech.tistory.com/357

 

[NLP] 문서 유사도 분석: (2) 유클리디안 거리(Euclidean Distance)

📚 목차 1. 유클리드 거리 개념 2. 유클리드 거리 실습 1. 유클리드 거리 개념 수학적 관점 접근 유클리드 거리(Euclidean Distance)는 두 점 사이의 거리를 계산하는 기법입니다. 두 점 \(p\)와 \(q\)가 각

heytech.tistory.com

2) 코사인 유사도

https://heytech.tistory.com/356

 

[NLP] 문서 유사도 분석: (1) 코사인 유사도(Cosine Similarity)

📚 목차 1. 코사인 유사도 개념 2. 코사인 유사도 실습 1. 코사인 유사도 개념 코사인 유사도(Cosine Similarity)란 두 벡터 사이의 각도를 계산하여 두 벡터가 얼마나 유사한지 측정하는 척도입니다.

heytech.tistory.com

3) 자카드 유사도

https://heytech.tistory.com/358

 

[NLP] 문서 유사도 분석: (3) 자카드 유사도(Jaccard Similarity)

📚 목차 1. 자카드 유사도 개념 2. 자카드 유사고 실습 1. 자카드 유사도 개념 자카드 유사도(Jaccard Similarity)는 \(2\)개의 집합 \(A\), \(B\)가 있을 때 두 집합의 합집합 중 교집합의 비율입니다. 즉,

heytech.tistory.com

 

728x90
반응형

'개발' 카테고리의 다른 글

선형패턴화  (0) 2022.11.21
퍼셉트론은 선형분류기, 다층퍼셉트론은 비선형분류기  (0) 2022.11.21
CountVectorizer 를 이용해서 문서에 나온 단어 빈도수 뽑아보기  (0) 2022.11.19
2022.11.17 특강  (0) 2022.11.17
텍스트 마이닝 총정리  (0) 2022.11.16
'개발' 카테고리의 다른 글
  • 선형패턴화
  • 퍼셉트론은 선형분류기, 다층퍼셉트론은 비선형분류기
  • CountVectorizer 를 이용해서 문서에 나온 단어 빈도수 뽑아보기
  • 2022.11.17 특강
내공얌냠
내공얌냠
내공냠냠
내공얌냠
내공냠냠
내공얌냠
전체
오늘
어제
  • 분류 전체보기 (254)
    • 개발 (113)
      • mediapipe (16)
      • insightface (5)
      • JongjuAR (3)
    • 자료구조 알고리즘 (79)
      • 코딩테스트 (64)
      • 이론 (15)
    • 공부 (7)
      • 단행본 (7)
      • 튜토리얼 (19)
      • 논문 (15)
      • 복기 (5)
    • 참여 (5)

블로그 메뉴

  • 홈
  • 태그
  • 미디어로그
  • 위치로그
  • 방명록

공지사항

인기 글

태그

  • 음성인식 튜토리얼
  • 컴퓨터 비전
  • flutter 행사
  • flutter conference
  • 딥러닝 기반 음성인식 기초
  • 컴퓨터 비전 책 추천
  • mediapipe translate
  • flutter tutorial
  • 머신러닝이란
  • postgresql install in mac
  • 깃 튜토리얼
  • google mediapipe
  • kubeflow설치가이드
  • 플러터 튜토리얼
  • 구글 미디어파이프
  • kubeflow설치안됨
  • ios google places api
  • 미디어파이프
  • vscode 스프링 설치
  • 음성인식 기초
  • mediapipe
  • flutter
  • python telegrambot
  • postgresql 재설치
  • 컴퓨터 비전 기초
  • flutter 행사 후기
  • speaker adaptation tts
  • torchscript vs onnx vs tensorrt
  • 플러터
  • git tutorial

최근 댓글

최근 글

hELLO · Designed By 정상우.v4.2.2
내공얌냠
문서 간 유사도를 구하는 3가지 방법
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.