로지스틱 회귀분석 개념 - 로지스틱 회귀 분석(Logistic Regression Analysis)은 반응변수가 범주형인 경우 적용되는 회귀 분석 모형 - 새로운 설명변수의 값이 주어질 때 반응변수의 각 범주에 속할 확률이 얼마인지를 추정하여 기준치에 따라 분류하는 목적 - 모형의 적합을 통해 추정된 확률을 사후 확률(Posterior Probability)로도 부른다.
로지스틱 회귀 분석 R 함수 glm(), cdplot(), step(), anova()
의사결정나무 개념 데이터들이 가진 속성들로부터 분할 기준 속성을 판별하고, 분할 기준 속성에 따라 트리 형태로 모델링 하는 분류 예측 모델
의사결정나무의 분석 과정 두음 : 성가타해 1. 의사결정 나무 성장 2. 가지치기 3. 타당성평가 4. 해석 및 예측
불순도의 여러가지 척도(이산형) 카이제곱 통계량 지니지수 엔트로피 지수
(연속형) F통계량 분산감소량
의사결정나무 알고리즘 두음 : 카씨차퀘 CART : 독립변수를 이분화 하는 과정, 이진트리 형태, 가장 널리 사용 C4.5와 C5.0 : 불순도의 측도로는 엔트로피 지수 사용, 다지분리 CHAID : 카이제곱 통계량, 다지 분리 QUEST : 범주 편향, CART의 문제점 개선, 편향 거의 없음, 분리규칙두단계나눔, 카이제곱통계량, 의진분리