Concentration inequalities
다양한 경우에 랜덤변수의 tails의 bound, 혹응 랜덤변수가 mean이나 median에 close 임을 보이기 위한 쌍방향 부등식의 획득은 괘 매력적임.
Motivation
일 경우에 이며, 노멀분포의 tail bound (혹은 Chernoff bound 에 의해) 는 이하를 생산함:
따라서 샘플평균 가 population 평균 와 크게 떨어져있을 확률은 빠르게 decay. 이를 응용해 finite 숫자의 샘플에 대해 과하게 많은 수의 가정 없이도 랜덤 샘플에 대한 bound 를 획득해보자.
From Markov to Chernoff
- Markov’s Inequality
given (nonnegative) 이며 (finite mean), 이하가 성립한다.
- Chebyshev’s inequality
(finite variance) 일 때 이하가 성립. 이는 Markov 부등식을 nonnegative 랜덤변수 에 적용한것.
이는 즉 가 작을 때 가 와 가깝다는 것을 보장한다는 점에서 가장 기초적인 contentration ineqaulity. Markov 와 Chebyshev 는 sharp 이며, 이는 곧 이 둘이 일반적으로는 imporve 될 수 없다는 것을 뜻함.
- Polynomial Markov
가 order 의 central moment 를 가진다면, 랜덤변수 에 Markov 부등식 적용하면 이하를 생산한다. 모든 integer 에 대해 order 의 central moment 가 존재한다면 2번째 ineq 도 성립.
- Chernoff bound
랜덤변수 가 0의 neighborhood 에서 mgf 를 가진다면, 즉 라고 가정하자. 이때 에서 랜덤변수 에 대해 Markov 부등식을 적용할 수 있으며, 이에 의해 upper bound 를 획득할 수 있다. 우리가 선택하는 를 Chernoff bound 에 최적화 시키면 (2.2)와 같이 나온다.
sub-Gaussian random variables
모든 랜덤변수 에 대해 그것의 mgf 가 를 만족하면 특정 tail bound 가 성립된다. 이를 응용하면 아래의 개념을 얻을 수 있다.
:::{.definition name=“sub-Gaussian”}
평균이 인 랜덤변수 X에 대해 에 대해 이하가 성립하면 이는 sub-Gaussian 이며 .
:::
- 는 sub-Gaussian 패러미터
- 는 variance proxy
symmetry 해보면 일 경우에만 .
이하의 값은 Example 2.1 과 동일하며, 따라서 모든 SG 랜덤변수는 이하의 ineq 를 만족한다.
- Jensen’s Ineq
convex 함수 에 대해 . g가 concave 면 逆.
Proof:
로 하고, 가 에서의 에 대한 tangent line, i.e. . convexity 에 의해 . 따라서
Properties of sub-Gaussian random variables
- 일 경우
- Hoeffding’s lemma: almost surely 하게 한 실수 가 있다면, .
- 이며 일 경우,
- $\forall a \in \mathbb R: aX \in SG \Big ( a^2 \sigma^2 \Big )
- if , then $X + Y \in SG \Big ( \sigma^2 + \gamma^2 \Big )
Proof for each.
- , Taylor’s thm 에 의해 이하가 성립. 쌍방을 으로 나누고 를 취하는 것으로 (1) 성립.
- 인 것만 보이면 됨. WLOG, 임을 가정. 는 x의 convex 이므로, .
따라서 를 가정하면, . 이때 와 라고 하고, 라고 하자. 이때 우리는 이하가 증명된다. . 이에 더해 이며 . 따라서 Taylor expansion 에 의해 이며 따라서 .
- (a) 는 SG 랜덤변수의 정의에 의해 trivial. (b) 를 증명하자. 임을 가정. 이때 이하가 도출된다.
- Holder 부등식
- by condition ,
- by letting , .
(c) 를 증명하다. 이므로, 을 가정하는 것으로, 이하에 의해 성립.
- Holder’s Inquality
with , it holds that
Proof. Observe that , 이는 Jensen 에 의해 성립. 이제 , 로 하고 양쪽에 expectation 취하는 것으로 ineq 성립.
Equivalent definitions
이하는 여부에 대해 equivalent. (up to multiplicative constants).
:::{.theorem}
zero-mean 인 모든 랜덤변수 에 대해 이하의 성질은 equiv.
:::
Sub-Gaussian random vectors
:::{.definition}
이하가 성립할 때 랜덤벡터 는 sub-Gaussian with variance proxy .
- 랜덤벡터 가 centered
- 랜덤변수 .
:::
Hoeffding’s inequality
독립인 SG 랜덤변수의 샘플 평균은 Hoeffding’s inequality 라는 exponential tail bound 를 갖는다.
:::{.theorem name=“Hoeffding’s inequality”}
independent , 들이 각각 라고 하자. 그러면 이하가 성립한다.
이는 Section 2.4의 property 3 과 inequality (2.4)에 의해 바로 구해진다.
:::
Hoeffding bound 는 보통
bounded 랜덤변수의 특별한 경우로서만 논해진다.
를 가정하자.
이 경우 Hoeffding’s lemma (property 2 in Section 2.4) 에 의해 , i.e., . 따라서 위의 thm에 의해
Maximal inequalities
finite 숫자의 SG 랜덤변수의 maximum 에 대한 tail / expectation bound 를 구할 수 있다.
:::{.theorem} let independent , . Then
:::
Proof:
- (2): condition 을 사용하면, 1번째는 , 2번째는 union bound 로 성립.
위를 응용하면 이하로 이어짐. 이는 위의 thm에서 abs 씌우고 n 을 2n 으로 바꾼 형.
:::{.exercise}
:::