순서형 로짓 모델
순서형 로짓(Ordered Logit) 모델은 종속 변수가 서열성을 가진 범주형(Categorical) 데이터일 때 활용되는 통계적 회귀 분석 방법이다. 순서형 로지스틱 회귀(Ordered Logistic Regression) 또는 비례 오즈 모형(Proportional Odds Model)이라고도 불린다.
이 모형은 소비자의 제품 만족도(매우 불만, 불만, 보통, 만족, 매우 만족), 학력 수준(중졸, 고졸, 대졸, 대학원졸) 또는 신용 등급과 같이 범주 간의 상대적 순서는 명확하게 존재하지만, 카테고리 간의 수학적 간격이 동일하지 않은 데이터(Ordinal Data)를 분석할 때 적용된다.
핵심 개념 및 가정 (Core Concepts & Assumptions)
잠재 변수 접근법 (Latent Variable Approach): 관측 종속 변수 의 배경에는 직접 관측되지 않는 연속형 잠재 변수(Unobserved continuous latent variable) 가 존재한다고 가정한다. 이 잠재 변수 가 특정 임계값(Thresholds 또는 Cutpoints)을 통과할 때마다 실제로 관측되는 의 카테고리가 달라지는 구조로 모델링한다.
비례 오즈 가정 (Proportional Odds Assumption): 평행선 가정(Parallel Lines Assumption)으로도 불리며, 순서형 로짓 모델이 성립하기 위한 가장 중요한 전제 조건이다. 이는 독립 변수가 종속 변수의 범주를 한 단계 상승시키는 데 미치는 영향력(회귀 계수, )이 어떤 범주 구간에서든 동일하다는 가정이다. 만약 데이터가 이 가정을 충족하지 못하면(즉, 범주 구간마다 독립 변수의 영향력이 다르면), 해당 모델을 사용할 수 없으며 일반화된 순서형 로짓이나 다항 로짓 모형을 사용해야 한다.
관련 회귀 모형 간의 비교 (Comparison of Regression Models)
분석 목적과 종속 변수의 특성에 따른 모델 선택 기준은 다음과 같다.
| 비교 항목 | 일반 선형 회귀 (OLS Regression) | 순서형 로짓 (Ordered Logit) | 다항 로짓 (Multinomial Logit) |
|---|---|---|---|
| 종속 변수 유형 (Dependent Variable) | 연속형 (Continuous) | 순서형 (Ordinal) | 명목형 (Nominal) |
| 변수의 특성 및 예시 | 키, 몸무게, 매출액 | 설문 척도 (1~5점), 등급 | 이동수단 선택 (버스, 지하철, 택시) |
| 범주 간 서열 정보 (Order) | - | 범주 간 서열이 의미 있음 | 범주 간 서열이 무의미함 |
| 범주 간 간격 (Intervals) | 동일함 (수학적 간격 일치) | 동일하지 않음 (알 수 없음) | 간격의 개념이 없음 |
| 주요 모델링 가정 (Key Assumption) | 정규성, 등분산성, 선형성 | 비례 오즈 가정 (평행선 가정) | 독립 대안의 무관성 (IIA) 가정 |
| 산출물 해석 기준 | 단위 증가에 따른 값의 변화량 | 높은 범주로 이동할 오즈비(Odds Ratio) | 기준 범주(Baseline) 대비 선택 확률 |
출처 (Sources):
- UCLA Advanced Research Computing: “Ordered Logistic Regression | Data Analysis Examples” (https://stats.oarc.ucla.edu/r/dae/ordinal-logistic-regression/)
- William H. Greene, Econometric Analysis (8th Edition), Pearson: Chapter 18 on Discrete Choice Models.
- Alan Agresti, Categorical Data Analysis (3rd Edition), Wiley: Section 8 on Models for Ordinal Dependent Variables.
- Penn State Eberly College of Science: “STAT 504: Analysis of Discrete Data - Ordered Logistic Regression” (https://online.stat.psu.edu/stat504/)