개발

원핫인코딩과 워드 임베딩

내공얌냠 2022. 11. 3. 13:37

완전 독립적일 수 있도록 원핫인코딩을 한다.

그러나 너무 길고 희소성이 높다. 유사한 것들을 모으고 싶다.

이런 사항들을 해결하기 위해 word2vec, GloVe 등의 방법이 있다.

원핫벡터는 고차원이고 표현은 희소성이 있고 학습을 하지 않으며 0 또는 1로 값이 구성되어있고,

임베딩 벡터는 저차원이고 표현이 밀집되어있으며 학습되어있고 실수표현이다.

728x90
반응형