Inference about Mean Vector (wk3)
Overview
Recall: univariate case
\begin{alignat*}{2} \text{test stat } &t &&=\tfrac{\bar X - \mu_0}{\tfrac{S}{\sqrt{n}}} &\overset{H_0}{\sim} t_{n-1} \\ &t^2 &&=\tfrac{(\bar X - \mu_0)^2}{\tfrac{S^2}{n}} &\overset{H_0}{\sim} F_{1, \; n-1} \end{alignat*}
reject if as below, which means upper th percentile.
therefore, with assumption ,
reject , if .
assumption check: $\pmb X_1 , \cdots, \pmb X_n \overset{iid}{\sim} N_p (\pmb \mu , \Sigma)$.
Remark
Hotelling’s T2T^2T2는
stat 는 측정 단위에 invariant.
proof)
let . then
therefore,
여기서 이 존재한다는게 뭔수로 보장되는거지?
여기서 의 존재를 보장하는 근거는 “측정 단위 변환”이 선형 변환이면서 가역적이어야 한다는 점 때문입니다.
1. 단위 변환이 선형변환 CCC로 표현되는 이유
-
예를 들어 cm → m, kg → g 같은 변환은 단순히 스케일링(scale matrix, 대각행렬) 입니다.
-
서로 다른 단위로 바꾼다고 해서 정보가 손실되면 안 되므로, 반드시 선형 + 전단사 변환이어야 합니다.
-
따라서 는 항상 정칙 행렬(nonsingular)로 가정합니다.
2. 가 가역이어야 하는 이유
Hotelling’s 는
꼴인데, 단위변환 후에도 동일한 값이 나오려면
이 성립해야 합니다.
이 항등식은 가 가역행렬일 때만 성립합니다.
즉, 의 존재는 수학적으로 불변성을 보이기 위한 필수 조건입니다.
3. 직관적인 해석
-
단위변환 행렬 는 보통 양의 대각 원소만 가진 대각행렬 (예: cm→m이면 0.01, kg→g이면 1000)입니다.
-
대각행렬의 경우, 모든 원소가 0이 아닌 한 역행렬이 존재합니다.
-
그러므로 단위변환을 정상적으로 정의한다면 은 항상 보장됩니다.
✅ 결론:
C−1C^{-1}C−1의 존재는 측정 단위를 바꾸는 선형변환이 반드시 가역적이어야 한다는 가정에서 보장됩니다. 즉, 단위변환이 단순 스케일 조정(대각행렬)이라면 원소가 0일 수 없으므로 자동으로 invertible 합니다.
혹시 원하시면 제가 “만약 CCC가 비가역이면 T2T^2T2 불변성이 깨지는 구체적 반례”도 만들어드
1. Confidence Region
Confidence Region
region , is CR of
the inequality will define a region .
The region is an ellipsoid centered at .
Testing at is equivalent to see whether falls within the CR.
- with ev , evec of ,
- CR Axis:
- CR half-length:
2. Simultaneous CI
let , then linear combination
therefore, CI for (at here, is fixed) is . This is not a simultaneous CI. let each be CI for . then simultaneous CI has confidence . need a wider interval.
let rs .
then, simultaneously for all , the interval will contain with probability .
Simultaneous CI for
let . then as below, where .
therefore, the simultaneous CI for , is .
at here, if we let .
then
therefore, the simultaneous CI for , is .
3. Note: Bonferroni Multiple Comparison
Bonferroni’s CI, , is more precise (narrower) than simultaneous CI.
4. Large Sample Inferences about a Mean Vector
Recall mv CLT:
let and for large. then
when the sample size is large, the MVN assumption is less critical. therefore,
let .
when is large, the is rejected if .
Note: , for large .
- CI:
the inequality will define a region, which means, region.
- Simultaneous CI:
let and for large. then
, simultaneous CI for .
- Simultaneous CI for
- Bonferroni’s CI for
- Bonferroni's CI is more precise. as also.
1. Profile Analysis (wk4, 5)
if , and the variables in are measured in the same unit, we may with to compare the means in .
ex) repeated measure: a measurement is taken at the same experimental unit successive times.
A profile is a plot, connecting
Question: is the profile flat?
if , then , thus when is true, then .
test stat
reject , if .
**Note: is not square, so there’s no inverse. thus in test stat doesn’t be canceled.
where , and . then
test stat
which means become .
2. Test for Linear Trend
suppose variables are measured across equally spaced time periods. Also suppose is rejected.
Question: Do the means fall onto a straight line?
at here, we acquire test stat .
3. Inferences about a Covariance Matrix
let rs .
let . then
then calculate function of -distribution.
- Test for Sphericity (Test for no Correlation)
function of -distribution.
- Test for Compound Symmetry
if , then has compound symmetry.
Compute , where
- .
- .
reject if
- .