Decision Tree
개념 1) 패턴을 변수의 조합으로 나타냄 2) 스무고개와 유사함 (yes or no) 개요 1) 데이터가 균일해지도록 2개 이상으로 분할 - 분류 : 비슷한 범주 기준 - 예측 : 비슷한 수치 기준 2) 이진분할에 의해서 끝마디의 분할된 데이터의 개수는 input개수와 동일하다. 3차원에서의 모형 예측 모델 1) 새로운 입력 데이터 (Xnew)에 대한 예측값 (Ynew)은 Xnew가 속하는 끝 노드 y값들의 평균값이 된다. (오류가 최소) 2) 과정 - 데이터를 m개로 분할 - cost function이 최소가 되도록 분할 3) 분할변수와 분할점 결정 방법 - 모든 분할변수와 분할점 경우의 수를 계산하며, cost function이 최소가 되는 순서로 노드를 생성한다. - 그리디 알고리즘과 맥락이 같다...