
6.1 다변량 데이터 공분산 행렬
▶ 피어슨 상관계수 계산
: 두 개의 변수 벡터 사이의 내적을 두 벡터 노름의 곱으로 나눔.
▶ 공분산 상관 행렬 계산
만약 변수가 3개 이상이라면? 다변량 데이터 집합에서 공분산 상관 행렬 계산
▶ 공분산
: 상관계수를 구하는 공식에서 분자 부분
: 두 평균중심화된 변수 사이의 내적
: 변수가 함께 이동하면 양수, 변수가 따로 이동하면 음수, 변수 사이에 선형 관계가 없을 때 0
▶ 공분산 방정식
ca,b=(n−1)−1∑ni=1(xi−ˉx)(yi−ˉy)
: ˜x를 x의 평균중심화된 변수라고 할 때, 공분산은 ˜xT˜y/(n−1)임.
: 다중 변수에서 이 공식을 구현할 때, 행렬 곱셈이 왼쪽 행렬의 행과 오른쪽 행렬의 열 사이의 내적들로 이루어진 집합이라는 사실을 이용하는 게 핵심.
- 공분산 행렬에 대한 행렬 방정식
C=XTX1n−1
: XT 행렬의 행은 X 행렬의 열이 됨. XTX는 모든 열과 열 사이의 공분산이 됨.
- C의 대각원소
: 각 변수의 자기 자신에 대한 공분산, 통계예서는 '분산' 이라고 함. 평균 주변에 흩어진 정도를 정량화한 것.
! 공분산 행렬은 항상 '특징 대 특징'이어야 함.
▶ 공분산 행렬을 상관 행렬로 변환
: 계산 식 R=SCS , R은 공분산 행렬이고, S는 변수의 역 표준 편차의 대각 행렬
: 파이썬 함수
np.cov()
np.corrcoef()
6.2 행렬-벡터 곱셈을 통한 기하학적 변환
행렬-벡터 곱셈의 목적 중에 하나는 좌표 집합을 기하학적으로 변환하는 것.
▶ '순수 회전 행렬'
: 길이를 유지하면서 벡터를 회전시킴.
[cos(θ)sin(θ)−sin(θ)cos(θ)]
: 기본적으로 직교 행렬임.
: T의 열들은 직교(내적이 cos(θ)sin(θ)−sin(θ)cos(θ)하고, 단위 벡터(cos^2(\theta)\,+\,sin^2(\theta)\,=\,1인 삼각 항등식)임.
: 일반적으로 대각선 원소는 x축과 y축 좌표의 크기를 조정하고,
대각선 외 원소는 두 축을 모두 늘림.
6.3 이미지 특징 탐지
▶ 이미지 필터링
: 2차원 커널을 설계한 다음 커널과 이미지의 겹쳐진 창 사이의 '내적'으로 구성된 새로운 이미지를 만듦.
: 두 행렬을 아다마르곱을 한 다음 모든 행렬 원소에 대해 합하면 됨.
'통계학, 인과추론 스터디 > 선형 대수학' 카테고리의 다른 글
선형 대수학 | Chapter 5. 행렬, 파트 2 : 행렬의 확장 개념 (1) | 2024.12.05 |
---|---|
선형 대수학 | Chapter 4. 행렬, 파트 1 : 행렬과 행렬의 기본 연산 (3) | 2024.12.04 |
선형 대수학 | Chapter 3. 벡터 응용 : 데이터 분석에서의 벡터 (0) | 2024.12.03 |
선형 대수학 | Chapter 2. 벡터, 파트2 : 벡터의 확장 개념 (0) | 2024.12.02 |
선형 대수학 | Chapter 1. 벡터, 파트1 : 벡터와 벡터의 기본 연산 (2) | 2024.11.29 |
댓글