목록의사결정나무 (1)
IT Dictionary

의사결정나무 의사결정나무는 데이터 마이닝 또는 머신러닝에서 사용되는 알고리즘입니다. 질문들에 대한 답을 해가면서 아래로 내려가는 모습이 나무와 비슷한 모양이고 데이터를 분류하는데 좋은 모델입니다. y변수가 범주형이라면 분류나무, 수치형이라면 회귀나무라고 할 수 있습니다. 지니 불순도 의사결정나무는 데이터를 얼마나 잘 분류했는가를 판단하는 것이 중요한데 지니 인덱스, 카이제곱 검정, 엔트로피 등을 기준으로 삼을 수 있습니다. Gini index를 기준으로 설명할 때, 지니 불순도가 작을수록 데이터가 잘 분류되어있다고 할 수 있습니다. 따라서, 지니 불순도를 통해 질문에 해당하는 노드 또는 변수들을 선택하면서 의사결정나무가 그려지게 됩니다. 속성 중요도 한 노드에서 데이터가 나뉘어졌을 때, 불순도의 변화량을..
데이터분석/머신러닝
2021. 5. 23. 22:57