구분지표데이터 유형주요 특징
명목형Cramer’s V명목 vs 명목범주형 데이터의 연관성 강도 (0~1)
서열형Spearman’s 서열 vs 서열순위 간의 직선적 경향성 측정
Kendall’s 서열 vs 서열표본이 적거나 동순위가 많을 때 유리
Gamma
(Goodman and Kruskal’s )
서열 vs 서열동순위 무시, 연관성 방향 확인
Somers’ D서열 vs 서열원인-결과 관계(비대칭) 분석 시 유용

명목 척도(Nominal) 간 상관계수

Cramer’s V (크라메르 V)

  • 교차분석 (Chi-square test) 후에 두 명목변수 사이의 상관관계 강도 측정
    • 0에서 1 사이의 값
    • 0에 가까울수록 상관관계가 없음
    • 1에 가까울수록 완전한 상관관계
  • 범주(Category)의 개수가 3개 이상인 다항 변수에서도 사용할 수 있어 범용성이 높음

서열 척도(Ordinal) 간 상관계수

  • 두 변수가 순위나 등급 (예: 학점, 만족도, 순위) 일 때 사용

Spearman’s Rho (스피어만 서열상관분석)

  • 두 변수의 순위(Rank) 간의 선형 관계 측정
    • −1에서 1 사이의 값
    • 데이터가 정규분포를 따르지 않거나, 비선형적이어도 단조성(Monotonicity)이 있다면 포착

Kendall’s Tau (켄달의 타우)

  • 스피어만과 비슷하게 순위의 상관관계 측정
  • ‘부합 쌍(Concordant pairs)‘의 비율을 계산
    • 스피어만보다 통계적으로 더 Robust (견고)
    • 표본 크기가 작거나 순위가 같은 데이터(Tied ranks) 가 많을 때 주로 사용

서열 척도 간, 방향성 및 예측 지표

  • 단순한 상관관계를 넘어
    • 한 변수가 다른 변수를 얼마나 예측하는지 확인 목적
    • 방향성이 어떠한지 확인 목적

Gamma (감마, Goodman and Kruskal’s Gamma)

  • 두 서열 변수 간의 대칭적인 연관성을 측정
    • 동일한 순위(Ties)를 고려하지 않고 오직 순위가 바뀐 경우만 계산에 포함
      • 따라서 동일 순위 데이터가 아주 많을 때 유용
    • 하지만 상관관계를 과대평가하는 경향이 있음

Somers’ D (소머즈 D)

  • 감마의 수정판

  • 한 변수를 독립변수로, 다른 변수를 종속변수로 설정하는 비대칭적 분석이 가능

    • 감마와 달리 동일 순위(Ties)를 분모에 포함하여 계산
    • “X의 순위가 Y의 순위를 예측하는 데 얼마나 도움이 되는가?” 를 나타냄