Cohen’s d

코헨의 d(Cohen’s d)는 통계학에서 두 집단의 차이가 실제로 얼마나 큰지(효과 크기, Effect Size)를 측정하는 가장 대표적인 지표입니다.

쉽게 말해, “A집단과 B집단의 평균이 다르다고 하는데, 그게 통계적으로만 의미가 있는 건지, 아니면 현실적으로 체감될 만큼 큰 차이인지”를 숫자로 보여주는 방법입니다.


1. 코헨의 d가 왜 필요한가? (p-value의 한계)

보통 연구를 할 때 p-value(유의확률)를 보고 “p < 0.05이므로 두 집단에 차이가 있다”고 결론을 내립니다. 하지만 p-value는 표본(샘플) 수가 많아지면 아주 미미한 차이라도 무조건 유의미하다고 나오는 단점이 있습니다.

  • 예시: 새로운 다이어트 약을 10만 명에게 먹였더니 평균 0.01kg이 빠졌습니다. 샘플 수가 너무 많아서 p-value는 0.001이 나왔습니다(통계적 유의성 확보). 하지만 현실에서 0.01kg 감량을 ‘효과가 있다’고 하지는 않습니다.
  • 이럴 때 코헨의 d를 계산해보면 효과 크기가 ‘매우 작음’으로 나와, 이 약이 현실적인 가치가 없음을 알게 해줍니다.

2. 계산 방법 (공식의 의미)

코헨의 d는 두 집단의 평균 차이를 ‘표준편차’ 단위로 나눈 값입니다.

    • : 두 집단의 평균 차이
    • : 통합 표준편차 (두 집단의 데이터가 퍼져있는 정도를 합친 것)

💡 직관적인 이해: 코헨의 d값이 1.0이라는 것은, 두 집단의 평균이 딱 표준편차 1만큼 떨어져 있다는 뜻입니다. 값이 클수록 두 집단의 분포가 덜 겹치고, 차이가 확연하다는 것을 의미합니다.

3. 코헨의 d 해석 기준 (Cohen’s Rule of Thumb)

제이콥 코헨(Jacob Cohen)은 이 값을 어떻게 해석할지에 대해 다음과 같은 일반적인 기준을 제시했습니다. (절댓값 기준)

  • : 작은 효과 (Small effect)
    • 두 집단의 차이가 있긴 하지만, 일반인의 눈으로는 거의 알아채기 힘든 수준입니다.
  • : 중간 효과 (Medium effect)
    • 육안으로도 어느 정도 차이를 느낄 수 있는 수준입니다. (예: 14세 여성과 15세 여성의 평균 키 차이 정도)
  • 이상 : 큰 효과 (Large effect)
    • 누가 봐도 명확하게 두 집단이 다르다고 느낄 수 있는 수준입니다. (예: 13세 여성과 18세 여성의 평균 키 차이 정도)

(주의: 이 기준은 절대적인 진리는 아니며, 연구하는 학문 분야(의학, 심리학, 공학 등)에 따라 기준이 달라질 수 있습니다.)

4. 요약

  • P-value는 “이 차이가 우연히 일어날 확률(차이가 존재하는가?)”을 묻는다면,
  • Cohen’s d는 “그래서 그 차이가 얼마나 유의미하게 큰가?”를 묻는 지표입니다.

따라서 현대의 통계 및 연구 논문에서는 p-value만 제시하지 않고, 코헨의 d와 같은 ‘효과 크기(Effect Size)‘를 함께 보고하는 것을 강력히 권장하고 있습니다.

Entities