빅데이터 김교수의 "AI노마드연구소" AI로 열어가는 노마드 세상!

빅데이터 김교수의 "AI노마드연구소" AI로 열어가는 노마드 세상입니다. AI 코딩작성, SNS 분석, AI업무자동화 컨설팅 0507-1419-0222

자세히보기

교육/빅데이터분석자격증교육

의사결정나무(Decision Tree)

빅데이터 김교수 2022. 4. 26. 11:14

의사결정 모형은 분류기법중 나무 구조(Tree)로 도표화하여 분류와 예측을 수행하는 분석 방법으로 분석과정이 직관적이고 이해하기 쉬운특징이 있다. 이 모형은 머신러닝중에서 Supervised Learning 방식으로 선형, 이산형에 공동으로 적용되고 있다. 

  • 데이터들의 속성을 기반으로 분할 기준을 판결하고, 분할 기준에 따라 트리 형태로 분기하여 모델링
  • 데이터 분석 결과가 의사결정 나무의 분기점을 통해 시각적으로 확인할 수 있어 해석이 용이

- itwiki(출처)

 

개요

   ㅁ 예측력과 해석력

      - 고객의 유치방안을 예측하고자 하는 경우에는 예측력에 치중한다.

      - 신용평가 부적합평가시, 부적격 시유 설명을 위해 해석력에 치중한다.

 

의사결정나무의 결정규칙

 

불순도 측정 지표

 

의사결정나무를 위한 알고리즘

 

  • 기출문제

기출문제를 확인해 보겠습니다. 지니지수는 불순도를 알아보는 지수로 아래의 예시를 보고 불순도를 구해 보겠습니다. 

 

 이 문제는 의사격정 나무의 분류기준에 대한 설명을 물어보는 문제입니다. 지니지수와 엔트로피지수 모두 작을 수록 순도가 높고, 불순도는 높습니다. 

다음문제는 의사결정나무의 일반개념을 묻는 문제입니다.

주관식 문제를 살펴볼까요