내 마음대로 공간

로지스틱 회귀분석 개념
- 로지스틱 회귀 분석(Logistic Regression Analysis)은 반응변수가 범주형인 경우 적용되는 회귀 분석 모형
- 새로운 설명변수의 값이 주어질 때 반응변수의 각 범주에 속할 확률이 얼마인지를 추정하여
  기준치에 따라 분류하는 목적
- 모형의 적합을 통해 추정된 확률을 사후 확률(Posterior Probability)로도 부른다.

로지스틱 회귀 분석 R 함수
glm(), cdplot(), step(), anova()

의사결정나무 개념
데이터들이 가진 속성들로부터 분할 기준 속성을 판별하고, 분할 기준 속성에 따라 트리 형태로
모델링 하는 분류 예측 모델

의사결정나무의 분석 과정
두음 : 성가타해
1. 의사결정 나무 성장
2. 가지치기 
3. 타당성평가
4. 해석 및 예측

불순도의 여러가지 척도(이산형)
카이제곱 통계량
지니지수
엔트로피 지수

(연속형)
F통계량
분산감소량


의사결정나무 알고리즘
두음 : 카씨차퀘
CART : 독립변수를 이분화 하는 과정, 이진트리 형태, 가장 널리 사용
C4.5와 C5.0 : 불순도의 측도로는 엔트로피 지수 사용, 다지분리
CHAID : 카이제곱 통계량, 다지 분리
QUEST : 범주 편향, CART의 문제점 개선, 편향 거의 없음, 분리규칙두단계나눔, 카이제곱통계량, 의진분리

728x90

공유하기

facebook twitter kakaoTalk kakaostory naver band
loading