Inference about Mean Vector (wk3)

Overview

Recall: univariate case

\begin{alignat*}{2} \text{test stat } &t &&=\tfrac{\bar X - \mu_0}{\tfrac{S}{\sqrt{n}}} &\overset{H_0}{\sim} t_{n-1} \\ &t^2 &&=\tfrac{(\bar X - \mu_0)^2}{\tfrac{S^2}{n}} &\overset{H_0}{\sim} F_{1, \; n-1} \end{alignat*}

reject if as below, which means upper th percentile.


therefore, with assumption ,

reject , if .



assumption check: $\pmb X_1 , \cdots, \pmb X_n \overset{iid}{\sim} N_p (\pmb \mu , \Sigma)$.

Remark

Hotelling’s T2T^2T2는

stat 는 측정 단위에 invariant.

proof)

let . then

therefore,

여기서 이 존재한다는게 뭔수로 보장되는거지?


여기서 의 존재를 보장하는 근거는 “측정 단위 변환”이 선형 변환이면서 가역적이어야 한다는 점 때문입니다.


1. 단위 변환이 선형변환 CCC로 표현되는 이유
  • 예를 들어 cm → m, kg → g 같은 변환은 단순히 스케일링(scale matrix, 대각행렬) 입니다.

  • 서로 다른 단위로 바꾼다고 해서 정보가 손실되면 안 되므로, 반드시 선형 + 전단사 변환이어야 합니다.

  • 따라서 는 항상 정칙 행렬(nonsingular)로 가정합니다.


2. 가 가역이어야 하는 이유

Hotelling’s

꼴인데, 단위변환 후에도 동일한 값이 나오려면

이 성립해야 합니다.
이 항등식은 가역행렬일 때만 성립합니다.

즉, 의 존재는 수학적으로 불변성을 보이기 위한 필수 조건입니다.


3. 직관적인 해석

  • 단위변환 행렬 는 보통 양의 대각 원소만 가진 대각행렬 (예: cm→m이면 0.01, kg→g이면 1000)입니다.

  • 대각행렬의 경우, 모든 원소가 0이 아닌 한 역행렬이 존재합니다.

  • 그러므로 단위변환을 정상적으로 정의한다면 은 항상 보장됩니다.


✅ 결론:
C−1C^{-1}C−1의 존재는 측정 단위를 바꾸는 선형변환이 반드시 가역적이어야 한다는 가정에서 보장됩니다. 즉, 단위변환이 단순 스케일 조정(대각행렬)이라면 원소가 0일 수 없으므로 자동으로 invertible 합니다.


혹시 원하시면 제가 “만약 CCC가 비가역이면 T2T^2T2 불변성이 깨지는 구체적 반례”도 만들어드


1. Confidence Region

Confidence Region

region , is CR of

the inequality will define a region .

The region is an ellipsoid centered at .

Testing at is equivalent to see whether falls within the CR.

  • with ev , evec of ,
    • CR Axis:
    • CR half-length:

2. Simultaneous CI

let , then linear combination

therefore, CI for (at here, is fixed) is . This is not a simultaneous CI. let each be CI for . then simultaneous CI has confidence . need a wider interval.

let rs .

then, simultaneously for all , the interval will contain with probability .

Simultaneous CI for

let . then as below, where .

therefore, the simultaneous CI for , is .


at here, if we let .

then

therefore, the simultaneous CI for , is .


3. Note: Bonferroni Multiple Comparison

Bonferroni’s CI, , is more precise (narrower) than simultaneous CI.


4. Large Sample Inferences about a Mean Vector

Recall mv CLT:

let and for large. then


when the sample size is large, the MVN assumption is less critical. therefore,

let .

when is large, the is rejected if .

Note: , for large .


  • CI:

the inequality will define a region, which means, region.

  • Simultaneous CI:

let and for large. then

, simultaneous CI for .

  • Simultaneous CI for
  • Bonferroni’s CI for
- Bonferroni's CI is more precise. as also. 

1. Profile Analysis (wk4, 5)

if , and the variables in are measured in the same unit, we may with to compare the means in .

ex) repeated measure: a measurement is taken at the same experimental unit successive times.

A profile is a plot, connecting


Question: is the profile flat?


if , then , thus when is true, then .

test stat

reject , if .

**Note: is not square, so there’s no inverse. thus in test stat doesn’t be canceled.

where , and . then

test stat

which means become .


2. Test for Linear Trend

suppose variables are measured across equally spaced time periods. Also suppose is rejected.

Question: Do the means fall onto a straight line?

at here, we acquire test stat .


3. Inferences about a Covariance Matrix

let rs .

let . then

then calculate function of -distribution.


  • Test for Sphericity (Test for no Correlation)

function of -distribution.


  • Test for Compound Symmetry

if , then has compound symmetry.

Compute , where

  • .
  • .

reject if

  • .