Train | Test Good | Bad 학습은 잘하는데 시험은 못 보는 경우 train x test x -> underfit train o test o -> fit train o test x -> overfit underfit, overfit 일 경우 학습을 잘 했는지 확인 학습을 잘 했으면 overfit, 학습도 못 했으면 underfit. 데이터 복잡도 > 모델 복잡도 : underfit 데이터 복잡도 < 모델 복잡도 : overfit 데이터 복잡도에 적절한 모델 복잡도를 가지고 있으면 fit 하다. underfit 은 모델의 복잡도를 끌어올리면 된다. overfit은 모델의 복잡도를 끌어내리면 된다. 모델의 복잡도를 올리거나 내리거나 하면 된다. 데이터 복잡도를 올리거나 내리는 것은 전처리. 어..
머신러닝이란
데이터의 패턴, 규칙성을 기계가 발견하도록 양도하는 것 대량의 데이터를 학습시킴으로써 내재적인 사람이 찾지 못하는 규칙을 기계가 찾도록 하여 대량의 데이터를 넣고 학습을 시킨다. 데이터의 상관관계를 학습한다. 데이터의 hypothesis(가설)을 학습하도록 하는 것 hypothesis는 우리가 잡고, 구성하고 있는 weight를 기계가 찾도록 하는 것. 우선순위가 없이 다양한 답이 나올 수 있기 때문에 폼은 우리가 정해줘야 한다. ex) y = 10x, y = x^3 + 6x^2 + 21x - 6... hypothesis의 폼을, 어떤 모델을 쓰는 것이 적합한지의 판단력을 기르기 위해 머신러닝을 공부하는 것이다. 기계가 학습해야 하는 것은 상관관계 hypothesis 중 weights를 학습하는 것이다...