1~11주차 총정리 데이터를 활용하여 모델에 쓰이는 파라미터를 적절한 값으로 찾아내는 것 즉, 데이터를 얼마나 잘 뽑아내서 훈련에 사용하느냐가 중요하다. 편향된 데이터인 경우 성능이 별로 좋지 않다. 레이블을 가진 데이터를 얻기 쉽지 않기 때문에 결국에는 데이터 싸움이다. 누가 좋은 데이터를 가졌느냐가 관건 (데이터의 중요성) 선형회귀 y = wx + b w와 b가 파라미터 k-nn 알고리즘 지도학습을 사용 주변에 인접해 있는 데이터를 이용해 클래스를 추정하는 방식 k-means algorithm 비지도학습 평균값으로 각각 클래스에 대해 대표적으로 나타내는 것 평균값을 업데이트하며 성능을 개선 k개의 평균값을 초기화 : 데이터 중 임의로 골라 사용 초기값에 따라 성능이 달라질 수 있음 k개의 평균과 새 ..