썸네일 선형 대수학 | Chapter 6. 행렬 응용 : 데이터 분석에서의 행렬 6.1 다변량 데이터 공분산 행렬 ▶ 피어슨 상관계수 계산: 두 개의 변수 벡터 사이의 내적을 두 벡터 노름의 곱으로 나눔. ▶ 공분산 상관 행렬 계산만약 변수가 3개 이상이라면? 다변량 데이터 집합에서 공분산 상관 행렬 계산  ▶ 공분산 : 상관계수를 구하는 공식에서 분자 부분: 두 평균중심화된 변수 사이의 내적: 변수가 함께 이동하면 양수, 변수가 따로 이동하면 음수, 변수 사이에 선형 관계가 없을 때 0 ▶ 공분산 방정식$c_{a, b} = (n-1)^{-1}\sum^{n}_{i=1}(x_{i}-\bar x)(y_{i}-\bar y)$: $\tilde x$를 $x$의 평균중심화된 변수라고 할 때, 공분산은 $\tilde{x}^{T}\tilde{y} / (n-1)$임.: 다중 변수에서 이 공식을 구현..
썸네일 선형 대수학 | Chapter 5. 행렬, 파트 2 : 행렬의 확장 개념 5.1 행렬 노름 (표기 : $||A||$ ) ▶ 행렬 노름 종류원소별 계열 : 원소별 노름은 행렬의 개별 원소를 기반으로 계산됨. 행렬의 원소의 크기를 반영해서 해석됨.유도 계열 : 행렬은 벡터를 변환하는 기능이 있는데 행렬의 유도별 노름은 이 변환으로 인해 벡터의 크기(노름)가 얼마나 조정되는지에(늘리거나 줄이거나) 대한 측정치인 것. ▶ 원소별 노름 → 가장 일반적으로 사용되는 노름은 유클리드 노름: 벡터 노름을 그대로 행렬에 확장한 것.유클리드 노름은 프로베니우스 노름이라고도 함. 프로베니우스 노름은 $l2$노름이라고도 함.모든 행렬 원소의 제곱합의 제곱근으로 계산됨.$||A||_{F} = \sqrt{\sum^{M}_{i=1}\sum^{N}_{j=1}a^2_{ij}}$인덱스 $i, j$는 각각 M..
썸네일 선형 대수학 | Chapter 4. 행렬, 파트 1 : 행렬과 행렬의 기본 연산 4.1 Numpy에서 행렬 생성과 시각화행렬 ( 표기  : $\mathbb{A}$ 또는 $\mathbb{M}$ )▶ 특수 행렬- 난수 행렬: 가우스(정규)와 같은 분포로부터 무작위로 추출된 숫자를 가진 행렬# 난수 생성 함수A = np.random.randn(4, 6) # 행 수, 열 수 - 정방 행렬과 비정방 행렬 ( 표기 : $\mathbb{R}^{N * N}$ ): 행 수와 열 수가 같은 행렬 : 행 수가 열 수보다 더 많으면 높다고 표현, 열 수가 행 수보다 더 많으면 넓다고 표현 - 대각 행렬: 행렬의 대각은 왼쪽 위에서 시작해 오른쪽 아래로 내려가는 원소들을 말함: 대각 행렬은 모든 비대각 원소가 0, 대각 원소는 0 또는 그 외의 값을 가질 수 있는 유일한 값# 대각 행렬 함수A = np.d..
썸네일 선형 대수학 | Chapter 3. 벡터 응용 : 데이터 분석에서의 벡터 3.1 상관관계와 코사인 유사도상관계수는 두 변수 사이의 선형 관계를 정량화한 하나의 숫자임.-1부터 1 사이의 값.  ▶ 피어슨 상관계수 수학 공식$\rho = \frac{\sum^{n}_{i=1}(x_{i}-\bar{x})(y_{i}-\bar{y})}{\sqrt{\sum^{n}_{i=1}(x_{i}-\bar{x})^2}\,\sqrt{\sum^{n}_{i=1}(y_{i}-\bar{y})^2 }}$- 각 변수의 평균 중심화 : 각 데이터값에서 평균값을 빼는 것- 벡터 노름 곱으로 내적 나누기 : 이러한 분할 정규화는 측정 단위를 제거하고 상관계수 최대 크기를 |1|로 조정함.  ▶ 선형대수학 용어로 나타낸 피어슨 상관계수$\rho = \frac{\tilde{x}^T\tilde{y}}{||\tilde{x}..
썸네일 선형 대수학 | Chapter 2. 벡터, 파트2 : 벡터의 확장 개념 2.1 벡터 집합집합 : 벡터들의 모음 2.2 선형 가중 결합 ▶ 선형 가중 결합: 여러 변수마다 가중치를 다르게 주어 정보를 혼합하는 방법.선형 혼합 또는 가중 결합이라고도 함. 가중 대신 계수라는 용어를 사용하기도 함.$w = \gamma_{1}v_{1} + \gamma_{2}v_{2} + ... + \gamma_{n}v_{n}$ 이 때 벡터의 차원은 모두 같다고 가정함. 2.3 선형 독립성벡터 집합의 속성임.$0 = \gamma_{1}v_{1} + \gamma_{2}v_{2} + ... + \gamma_{n}v_{n}, \;\gamma\in\mathbb{R}$ ▶ 선형 종속성 : 적어도 하나의 벡터가 집합 내의 다르나 벡터들의 선형 가중 결합으로 나타낼 수 있는 경우의 벡터 집합 상태- 선형 종속적..
썸네일 선형 대수학 | Chapter 1. 벡터, 파트1 : 벡터와 벡터의 기본 연산 1.1 Numpy로 벡터 생성 및 시각화하기벡터 : 수의 나열차원 : 벡터가 가진 원소의 수방향 : 열 방향(높이 세워진 형태), 행 방향(평평하게 누운 형태)  수학코드차원벡터가 가진 원소의 수벡터의 길이(length) 또는 모양(shpae)예시 ex) 모든 벡터는 벡터가 가진 원소의 수(수학적 차원)에 상관없이 Numpy에서 '2차원 배열'로 간주됨.특정 방향이 없는 수 나열은 원소 수에 상관없이 파이썬에서 1차원 배열임. 보통 벡터에 아무런 표시가 없으면 열 방향이라고 가정함.행 벡터의 경우에 $w^T$로 씀. 여기에서 $T$는 전치 연산을 나타냄. ▶ 벡터의 기하학적 해석대수학적 해석 : 순서대로 나열된 수 목록기하학적 해석 : 특정 길이(또는 크기)와 방향(또는 각도 : 양의 $x$축을 기준으로..
썸네일 그로스 해킹 | 전제조건 : Product-Market Fit, AARRR 제품-시장 적합성 (PMF : Product-Market Fit) 제품-시장 적합성문제라고 생각했던 것이 정말 문제가 맞는지 검토해보기또 해결책을 내놓을 때 그 해결책에 대한 대가를 지불할 만큼의 수요가 있는지도 살펴보기제품을 통해 검증하려고 했던 가설이 무엇이고, 검증 결과가 어땠는지 확인해보기 제품-시장 적합성 확인법  1) 리텐션  2) 전환율 : 가입이나 결제 같은 주요 이벤트의 전환율 살펴보기  3) 순수 추천 지수 (NPS : Net Promoter Score)$NPS = \frac{적극적 추천 그룹 - 비추천 그룹}{전체 응답자}$ 제품의 성공 여부를 확인할 때 적절하지 않은 지표설치 수 가입자 수누적으로 쌓이는 지표 제품-시장 적합성 개선을 위한 노력지표 자체를 개선하는 것이 목적이 되어서..
썸네일 그로스 해킹 | 2024 데이터 넥스트레벨 챌린지 4기 참여 데이터 넥스트레벨 챌린지데이터리안에서 데이터 넥스트레벨 챌린지(이하 데벨챌) 4기 신청자를 모집했다.https://datarian.io/blog/data-next-level-challenge-4th-noti 일잘러의 필독서 ‘그로스 해킹’ 함께 읽고, 저자 북토크 까지 함께해요 (신청 마감)데이터 분석가의 추천 도서 함께 읽어요!datarian.io 그로스 해킹이번에 읽게 될 책은 양승화 님의 '그로스 해킹'이다. 마케팅 또는 데이터 분석에 관심이 있다고 하면 꼭 읽어보라고 추천을 받는 책이다.이 책은 내가 데이터 분석에 관심이 생긴 뒤 읽었던 첫 책이기도 하다.관련 지식이라고는 하나도 없었던 시절,이 책에서 소개하는 개념들은 나에게 생소하기만 했고, 이해하기가 어려웠다.결국 1/3도 제대로 이해하지 못..
썸네일 스파르타 코딩클럽 | 내일배움캠프 : 데이터 분석 과정 수료생 솔직한 찐 후기 2024년 상반기, 스파르타 코딩클럽의 내일배움캠프에서 데이터 분석가 양성과정을 수료했다.이 과정을 먼저 거쳐간 사람으로서 나의 경험을 담은 솔직한 후기를 남겨보려고 한다.나의 경험담이 이 글을 보시는 분들에게 충분한 고민을 하게 하고, 현명한 선택을 내릴 수 있게 도움을 드리면 좋겠다. '데이터 분석'에 관심은 있는데..내일배움캠프에 참여하기 전 나는 그저 '데이터 분석'에 관심이 많은 비전공자였다. 비전공자라는 패널티를 없애고 싶은 마음에 '관련 지식부터 채워보자' 라는 생각으로 자격증 공부를 열심히 했다. 그 결과, 컴퓨터활용능력 1급, 사회조사분석사 2급, SQLD와 ADsP 자격증을 취득했다.하지만 단순히 자격증 지식을 채우는 것만으로는 내가 생각하는 '데이터 분석'을 할 수 있는 수준에 도달하..