개발
원핫인코딩과 워드 임베딩
내공얌냠
2022. 11. 3. 13:37
완전 독립적일 수 있도록 원핫인코딩을 한다.
그러나 너무 길고 희소성이 높다. 유사한 것들을 모으고 싶다.
이런 사항들을 해결하기 위해 word2vec, GloVe 등의 방법이 있다.
원핫벡터는 고차원이고 표현은 희소성이 있고 학습을 하지 않으며 0 또는 1로 값이 구성되어있고,
임베딩 벡터는 저차원이고 표현이 밀집되어있으며 학습되어있고 실수표현이다.
728x90
반응형