Neyman–Pearson lemma
rs 이고, . 이때 이하를 만족하면 rejection region 은 MP test의 기각역.
:
- if .
- if .
- for the prefiexed significance level .
Proof:
이므로, 라면
마찬가지 방법으로 라면 .
의 유의수준이 라 하고, 유의수준이 동일한 임의의 RR 를 가정하자. 이때 두 RR은 각각
로 표현할 수 있으며, 두 RR에 대한 power function은 각각
이때 에서 두 power의 차이는
이에 의해 MP test의 정의를 만족한다. 이때 의 유의수준이 인 경우, 이 되므로, 의 에서의 power인 은 유의수준이 인 모든 RR의 power보다 크거나 같음을 알 수 있다.
Overview
- Example
| 1 | 2 | 3 | 4 | 5 | 6 | |
|---|---|---|---|---|---|---|
| .01 | .02 | .02 | .05 | .10 | .80 | |
| .03 | .05 | .15 | .10 | 0 | .67 | |
| .33 | .4 | .13 | .5 | 1.19 |
유의수준이란 기본적으로 이 사실인데 을 선택할 확률. 선택한 RR에 해당하는 와 에서의 density가 각각 있다면, 에서의 density의 합이 된다. 기각을 해버렸는데 가 발생해버렸다는 소리니까.
power란 RR에서의 이 발생할 확률.
test 자체가 에 마음을 두고 시작하는 거임. power는 무조건 에만 직결. 실패하면 어쩌지? 무지성으로 골라버리자. 이랬다가 발생해버리면? 난 망하는거잖아. 이 망함의 risk를 고정해두자. 이게 .
power function은 와 각각에 대해서 존재한다. 이는 각각에서의 pdf이다.
즉, 표본을 통한 의 값이 크면 를 기각할 이유가 없고, 작으면 기각할 근거를 갖는다. 이 값이 얼마나 작아야 기각할 수 있는가는 유의수준에 의해 결정. 이와 같이 rs의 LR을 통해 MP test의 RR을 찾을 수 있다. 이때 RR과 검정법은 실제로 동일한 것이므로 혼돈이 없다는 전제 하에 test라는 단어를 주로 사용한다.
는 표본의 에 대한 지지 (그리고 에 대한 반증)의 정도를 표현한다고 볼 수 있다.
Generalized LRT
rs , , .
rs 의 pdf가 라고 하자. 확률구간 가
를 만족하면 이를 패러미터 의 CI라 부른다.
rs 의 분포가 pdf 를 따른다 하자. 이때 샘플과 패러미터 의 함수인 random quantity 의 분포가 패러미터 에 의존하지 않으면 이는 pivotal quantity.
에 대한 RR 가 이하를 만족하면 이는 UMP test. 가 이 test의 power function이라면
모든 다른 power function에 대해 위의 기각역에서의 power 가 최대.
rs 의 joint pdf가 일 때, 가 에 대해 의 non-dec 혹은 non-inc라면 는 에 대해 monotone LR를 갖는다.
- Karlin-Rubin
. 가 에 대한 SS임을 가정하고, 의 pdf의 family는 MLR을 가짐. then , reject 하는 test는 level 의 UMP test이다. 이때, .
이 에 대해 non-inc인 MLR. 이때
에 대한 level 의 UMP test는 이며, 상수 는 에 의해 결정.
는 .
MLE의 불변성
MLE의 함수는 MLE
서로 독립인 rv X Y의 공통된 성공 확률 p의 MLE. f(X)와 f(Y)를 곱해서 쓴다.
. 이때 LF로 MLE 구하는 건 굳이 log 안 거쳐도 가능함. 안 거쳐야 증명이 깔끔한 부분이 있음.
에 의해
일 때, 의 UE는? 이므로 는 의 UE.
일 때, 가 의 UE가 되기 위한 c의 값은?
. 이때 가 의 UE가 되도록 하는 c의 값은?
이 카이제곱을 따르는 rv임을 이용하여 를 구하라.
는 일 때 최소화.
통계량 의 분포가 패러미터 에 의존하지 않는다면 이는 ancillary statistic.
최소 SS가 존재한다면, 모든 CSS는 MSS이다.