썸네일 선형 대수학 | Chapter 6. 행렬 응용 : 데이터 분석에서의 행렬 6.1 다변량 데이터 공분산 행렬 ▶ 피어슨 상관계수 계산: 두 개의 변수 벡터 사이의 내적을 두 벡터 노름의 곱으로 나눔. ▶ 공분산 상관 행렬 계산만약 변수가 3개 이상이라면? 다변량 데이터 집합에서 공분산 상관 행렬 계산  ▶ 공분산 : 상관계수를 구하는 공식에서 분자 부분: 두 평균중심화된 변수 사이의 내적: 변수가 함께 이동하면 양수, 변수가 따로 이동하면 음수, 변수 사이에 선형 관계가 없을 때 0 ▶ 공분산 방정식$c_{a, b} = (n-1)^{-1}\sum^{n}_{i=1}(x_{i}-\bar x)(y_{i}-\bar y)$: $\tilde x$를 $x$의 평균중심화된 변수라고 할 때, 공분산은 $\tilde{x}^{T}\tilde{y} / (n-1)$임.: 다중 변수에서 이 공식을 구현..
썸네일 선형 대수학 | Chapter 5. 행렬, 파트 2 : 행렬의 확장 개념 5.1 행렬 노름 (표기 : $||A||$ ) ▶ 행렬 노름 종류원소별 계열 : 원소별 노름은 행렬의 개별 원소를 기반으로 계산됨. 행렬의 원소의 크기를 반영해서 해석됨.유도 계열 : 행렬은 벡터를 변환하는 기능이 있는데 행렬의 유도별 노름은 이 변환으로 인해 벡터의 크기(노름)가 얼마나 조정되는지에(늘리거나 줄이거나) 대한 측정치인 것. ▶ 원소별 노름 → 가장 일반적으로 사용되는 노름은 유클리드 노름: 벡터 노름을 그대로 행렬에 확장한 것.유클리드 노름은 프로베니우스 노름이라고도 함. 프로베니우스 노름은 $l2$노름이라고도 함.모든 행렬 원소의 제곱합의 제곱근으로 계산됨.$||A||_{F} = \sqrt{\sum^{M}_{i=1}\sum^{N}_{j=1}a^2_{ij}}$인덱스 $i, j$는 각각 M..
썸네일 선형 대수학 | Chapter 4. 행렬, 파트 1 : 행렬과 행렬의 기본 연산 4.1 Numpy에서 행렬 생성과 시각화행렬 ( 표기  : $\mathbb{A}$ 또는 $\mathbb{M}$ )▶ 특수 행렬- 난수 행렬: 가우스(정규)와 같은 분포로부터 무작위로 추출된 숫자를 가진 행렬# 난수 생성 함수A = np.random.randn(4, 6) # 행 수, 열 수 - 정방 행렬과 비정방 행렬 ( 표기 : $\mathbb{R}^{N * N}$ ): 행 수와 열 수가 같은 행렬 : 행 수가 열 수보다 더 많으면 높다고 표현, 열 수가 행 수보다 더 많으면 넓다고 표현 - 대각 행렬: 행렬의 대각은 왼쪽 위에서 시작해 오른쪽 아래로 내려가는 원소들을 말함: 대각 행렬은 모든 비대각 원소가 0, 대각 원소는 0 또는 그 외의 값을 가질 수 있는 유일한 값# 대각 행렬 함수A = np.d..
썸네일 선형 대수학 | Chapter 3. 벡터 응용 : 데이터 분석에서의 벡터 3.1 상관관계와 코사인 유사도상관계수는 두 변수 사이의 선형 관계를 정량화한 하나의 숫자임.-1부터 1 사이의 값.  ▶ 피어슨 상관계수 수학 공식$\rho = \frac{\sum^{n}_{i=1}(x_{i}-\bar{x})(y_{i}-\bar{y})}{\sqrt{\sum^{n}_{i=1}(x_{i}-\bar{x})^2}\,\sqrt{\sum^{n}_{i=1}(y_{i}-\bar{y})^2 }}$- 각 변수의 평균 중심화 : 각 데이터값에서 평균값을 빼는 것- 벡터 노름 곱으로 내적 나누기 : 이러한 분할 정규화는 측정 단위를 제거하고 상관계수 최대 크기를 |1|로 조정함.  ▶ 선형대수학 용어로 나타낸 피어슨 상관계수$\rho = \frac{\tilde{x}^T\tilde{y}}{||\tilde{x}..
썸네일 선형 대수학 | Chapter 2. 벡터, 파트2 : 벡터의 확장 개념 2.1 벡터 집합집합 : 벡터들의 모음 2.2 선형 가중 결합 ▶ 선형 가중 결합: 여러 변수마다 가중치를 다르게 주어 정보를 혼합하는 방법.선형 혼합 또는 가중 결합이라고도 함. 가중 대신 계수라는 용어를 사용하기도 함.$w = \gamma_{1}v_{1} + \gamma_{2}v_{2} + ... + \gamma_{n}v_{n}$ 이 때 벡터의 차원은 모두 같다고 가정함. 2.3 선형 독립성벡터 집합의 속성임.$0 = \gamma_{1}v_{1} + \gamma_{2}v_{2} + ... + \gamma_{n}v_{n}, \;\gamma\in\mathbb{R}$ ▶ 선형 종속성 : 적어도 하나의 벡터가 집합 내의 다르나 벡터들의 선형 가중 결합으로 나타낼 수 있는 경우의 벡터 집합 상태- 선형 종속적..
썸네일 선형 대수학 | Chapter 1. 벡터, 파트1 : 벡터와 벡터의 기본 연산 1.1 Numpy로 벡터 생성 및 시각화하기벡터 : 수의 나열차원 : 벡터가 가진 원소의 수방향 : 열 방향(높이 세워진 형태), 행 방향(평평하게 누운 형태)  수학코드차원벡터가 가진 원소의 수벡터의 길이(length) 또는 모양(shpae)예시 ex) 모든 벡터는 벡터가 가진 원소의 수(수학적 차원)에 상관없이 Numpy에서 '2차원 배열'로 간주됨.특정 방향이 없는 수 나열은 원소 수에 상관없이 파이썬에서 1차원 배열임. 보통 벡터에 아무런 표시가 없으면 열 방향이라고 가정함.행 벡터의 경우에 $w^T$로 씀. 여기에서 $T$는 전치 연산을 나타냄. ▶ 벡터의 기하학적 해석대수학적 해석 : 순서대로 나열된 수 목록기하학적 해석 : 특정 길이(또는 크기)와 방향(또는 각도 : 양의 $x$축을 기준으로..
썸네일 선형대수학 Khan Academy | 1단원. 벡터와 공간(2) 5. 벡터의 내적과 외적# 벡터의 내적과 벡터의 길이▶ 벡터의 곱 혹은 그 결과를 만들기 위한 방법 두가지 : 내적, 외적내적(Dot Product) : $\vec{a}·\vec{b}$ → 두 벡터를 곱해 스칼라 값을 가지게 됨벡터의 길이(Length) : $||\vec{a}|| = \sqrt{a_{1}^2 + a_{2}^2 +...+ a_{n}^2}$ → 피타고라스 정리 생각하면 편함 # 벡터 내적의 성질 증명각각의 성분에 대해서 일반적인 수에 대한 교환법칙, 분배법칙, 결합법칙이 벡터와 내적에서도 비슷하게 적용될 수 있음▶ 교환법칙 : 내적에서는 곱의 순서가 중요하지 않음$\vec{v} · \vec{w} = \vec{w} · \vec{v}$$ \vec{v} · \vec{w} = v_{1}w_{1} +..
썸네일 선형대수학 Khan Academy | 1단원. 벡터와 공간(1) 1. 벡터# 벡터 벡터는 크기와 방향을 동시에 나타냄   ex) 속도HTML 삽입미리보기할 수 없는 소스어디에서 시작하는지, 어디에 표현하는지는 상관 없음좌표 (0,0)에서 시작을 했든 좌표 (5,5)에서 시작을 했든 크기와 방향만 같다면 다 같은 벡터임 # 실좌표공간 n차원 실수좌표공간 $\mathbb{R}^n$  : 가능한 모든 실수값을 가지는 n-튜플 # 대수와 그래프를 이용한 벡터의 덧셈 # 벡터와 스칼라의 뺄셈 # 벡터와 스칼라의 곱셈벡터에 상수(스칼라)를 곱해주면 방향은 바뀌지 않고, 크기만 바뀜벡터에 음수(스칼라)를 곱하면 방향이 바뀜 # 단위벡터(unit vector)수평으로 한 칸HTML 삽입미리보기할 수 없는 소스 수직으로 한 칸HTML 삽입미리보기할 수 없는 소스 모든 벡터는 단위 벡..
썸네일 인과추론 | Chapter 5. 성향점수 성향점수5.1 관리자 교육의 효과[ 관리자 교육의 효과 실험 ]목적 : 관리자 교육과 직원 참여도 간의 인과관계 추정프로그램에 등록된 관리자의 직원들과 등록되지 않은 직원들에 대한 참여도 비교실험 설계 : 관리자들을 무작위로 프로그램에 참여시키기                    → 불응 발생 (프로그램에 참여해야 할 관리자는 참여X, 참석 대상이 아닌 관리자는 참여O)                  → 교란 요인 발생 (처치가 무작위로 배정되지 않음)  교란 요인을 보정해 실험군과 대조군을 비교할 수 있도록 해야 함. 5.2 회귀분석과 보정성향점수 가중치 추정값이 회귀 추정값과 같은지 확인해보기[ 회귀 추정값으로 교란요인 보정 ]실험군과 대조군을 단순 비교하면 편향된 결과가 나옴데이터에 있는 공변량을 ..