데이터의 패턴, 규칙성을 기계가 발견하도록 양도하는 것
대량의 데이터를 학습시킴으로써 내재적인 사람이 찾지 못하는 규칙을 기계가 찾도록 하여 대량의 데이터를 넣고 학습을 시킨다.
데이터의 상관관계를 학습한다.
데이터의 hypothesis(가설)을 학습하도록 하는 것
hypothesis는 우리가 잡고, 구성하고 있는 weight를 기계가 찾도록 하는 것.
우선순위가 없이 다양한 답이 나올 수 있기 때문에 폼은 우리가 정해줘야 한다.
ex) y = 10x, y = x^3 + 6x^2 + 21x - 6...
hypothesis의 폼을, 어떤 모델을 쓰는 것이 적합한지의 판단력을 기르기 위해 머신러닝을 공부하는 것이다.
기계가 학습해야 하는 것은 상관관계 hypothesis 중 weights를 학습하는 것이다.
결국 ML는 weights를 찾는 것이다.
실제값과 예측값의 차이를 오차라고 한다.
오차를 종합한 것을 cost 라고 한다.
cost가 클 경우 hypothesis는 나쁜 것
cost가 낮은 경우 좋은 hypothesis.
weights를 어떻게 찾느냐에 따라 cost가 높을 수도 있고 낮을 수도 있다.
우리는 cost가 낮은 weights를 찾는 것이다.
결국, ML이란 cost가 낮은(예측과 실제 차이가 적은) weights(hypothesis의 폼은 사람이 정하고, 기계는) 찾기
weights를 갖지 않는 모델도 있지만 핵심적인 개념이고, 같은 맥락에서 이해할 수 있기 때문에.
수식으로 표현해보면,
arg-min(minA), arg-max(maxA)
minA : A가 최소가 되게 하는 B를 찾겠다.
B
min Cost
w
ML이란 minCost weight 이다.
'개발' 카테고리의 다른 글
How minCost W? (0) | 2022.11.08 |
---|---|
지도 비지도학습 차이 (0) | 2022.11.08 |
N-gram (0) | 2022.11.03 |
원핫인코딩과 워드 임베딩 (0) | 2022.11.03 |
TF-IDF (0) | 2022.11.03 |