1. 분류분석과 예측분석
| 분류분석 | 예측분석 |
|---|---|
| 데이터가 어떤 그룹에 속하는지 예측 클러스터링과 유사하나, 분류분석은 각 그룹이 정의되어 있음 지도학습 | 시간에 따른 값 2개만을 이용해, 앞으로의 매출/온도 예측 (EX. 시계열분석) 모델링되는 입력 데이터가 무엇인지에 따라 특성 다름 여러개의 다양한 설명변수가 아닌, 한개의 설명변수로 생각하면 된다 |
| 레코드의 특정 속성의 값을 미리 알아맞히는 점 | 레코드의 특정 속성의 값을 미리 알아맞히는 점 |
| 레코드(튜플) 의 범주형 속성의 값을 알아맞힘 | 레코드(튜플) 의 얀석향속성의 값을 알아맞힘 |
| EX. 학생의 국어, 영어, 수학 점수를 통해 내신등급 맞히기 카드회사에서 회원의 가입 정보를 통해 1년 후 신용등급 맞히기 | 학생들의 여러가지 정보를 통해 수능점수 맞히기 카드회사 회원 가입정보를 통해 연 매출액 맞히기 |
-
분류 모델링
- 신용평가모형 (우량, 불량)
- 사기방지모형 (사기, 정상)
- 이탈모형 (이탈, 유지)
- 고객세분화 (VVIP, SILVER, BRONZE)
-
분류기법
2. 로지스틱 회귀분석
3. 의사결정나무
7. 나이브 베이즈 분류
- 데이터에서 변수들에 대한 조건부 독립을 가정하는 알고리즘
- 베이즈 정리 이용
- 클래스에 대한 사전 정보와, 데이터로부터 추출된 정보를 결합