Matrix concentration inequalities

이전 강의에서는 샘플 Cov Matrix의 tail bound를 discretization argument 를 통해 탐색했음. 여기선 Matrix Chernoff 테크닉을 통해 탐색한 후 랜덤 매트릭스에 Hoeffding bound 와 Bernstein bound 를 제시할거임.







Matrix calculus

symmetric Matrix 의 set 와 ev 가 non-negative 인 PSD Matrix의 subset 를 사용할 것.







Matrix Chernoff

independent symmetric 랜덤 매트릭스의 collection 가 주어졌고 . 이때 의 maximum ev를 $P(\lambda_{max} (\hat X) \ge T) 와 같이 bound하고 싶다. Chernoff argument 를 쓰는 것이 일반적. 적용하면:

  • 2번째 등식에선 exponential 함수의 spectral mapping property 과 monotonicity 사용 function
  • standard Markov 부등식
  • 가 PSD Matrix 라는 사실 활용
  • trace 가 linear operator이며, it can commute with expectation

위의 전개에서 모든 에 inf를 적용하면 Chernoff argument 완성. 이제 를 bound 해야 함. 일반적인 스칼라 케이스에서 평균의 exponential 은 그냥 prod 로 쓰일 수 있음. 이를 연장하여 우리는 개별 랜덤변수들의 mgf 생산까지도 끌고갈 수 있음. 하지만 매트릭스 exponential 에서 려면 여야 함. 따라서 우리는 의 임의의 실현값에 직접적으로 factorization 적용하는 건 불가능함. 이때 Lieb’s inequality 적용하면 이 난점 돌파 가능.







Sub-Gaussian and sub-exponential matrices

실값 랜덤변수의 케이스와 같이, 우리는 랜덤 매트릭스의 class 를 이들의 mgf 사용해서 특성을 드러내는 것이 가능.

:::{..def “Sub-Gaussian random matrices”}

symmetric Matrix , 이때 , 는 이하를 만족할 경우 matrix 패러미터 를 가지는 sub-Gaussian.

:::

  • ※Remark: 패러미터 를 가지는 Sub-Gaussian 랜덤 매트릭스는 패러미터 을 가지는 sub-exponential이기도 하다.






랜덤 매트릭스에 대한 Hoeffding and Bernstein bounds




Hoeffding bound

:::{..def “Hoeffding bound for random matrices”}

Let independent 한 zero-mean symmetric 랜덤 매트릭스의 sequence , 이에 더해 이 랜덤 매트릭스들은 패러미터 를 가지는 sub-Gaussian 조건을 만족한다. 이때 우리는 이하와 같은 upper tail bound 를 얻는다.

:::




Bernstein bound

:::{..def “Variance of random matrices”}

랜덤 매트릭스 에 대해, 이의 Var을 아래와 같이 정의한다. 이때 Var(X)는 자연스럽게 PSD.

:::

:::{..def “Bernstein bound for random matrices”}

bounded operator norm 을 가지는, zero-mean independent symmetric 랜덤 매트릭스의 sequence 를 로 하자. 이에 더해 . 이때

:::

Let independent 한 zero-mean symmetric 랜덤 매트릭스의 sequence , 이에 더해 이 랜덤 매트릭스들은 패러미터 를 가지는 sub-Gaussian 조건을 만족한다. 이때 우리는 이하와 같은 upper tail bound 를 얻는다.

:::




Generalization to non-symmetric/rectangular matrices

이렇게 symmetric (그리고 당연히 square) 매트릭스의 concentration bounds 를 살펴봤음. 하지만 이 bounds는 non-symmetric 에도, 그리고 nonsquare 에도 적용할 수 있도록 확장 가능함. 바로 self-adjoint dilation 을 사용해서.

랜덤 매트릭스 가 주어졌음. 이제 다음과 같은 매트릭스 생산:

가 symmetric 임을 보이는 건 쉬움. 더욱 중요한 것은, 임을 보이는 것도 가능.^[Tropp, Joel A. ”User-friendly tail bounds for sums of random matrices.” Foundations of computational mathematics 12.4 (2012): 389-434] 따라서 이하와 같으며, 의 mgf 에 특정한 조건을 부여하는 것으로 위에서 진행해온 프로세스를 그대로 적용할 수 있다.