썸네일 통계학 Khan Academy | 14~16단원 (카이제곱 검정, 회귀분석, 분산분석) 1. 14단원 : 범주형 자료의 추론1-1. 카이제곱 적합도 검정▶ 카이제곱분포란? 표준정규분포에서 표집해 얻은 숫자를 제곱하는 것HTML 삽입미리보기할 수 없는 소스제곱을 하기 때문에 항상 양수가 됨χ^2 분포의 밑수 1은 자유도를 나타내는 것 ▶ 피어슨의 카이제곱검정(적합도)적합도 검정은 카이제곱검정의 한 유형으로 한 범주형 변수에 대한 분석 방법을 말함사전에 알고있던(또는 주장되던) 값이 실제 관측되는 데이터와 일치하는지 검정함계산된 값이 임계점의 카이제곱값보다 더 극값이면 귀무가설 기각임계점의 카이제곱값 확인 (← α 와 자유도(n-1)를 알면 알 수 있음) 1-2. 동질성과 연관성 / 독립성에 대한 카이제곱 검정 ▶ 독립사건의 빈도표 채우기* 비가 오는 것과 어머니가 불평이 많은 것은 독립사건이..
썸네일 통계학 Khan Academy | 13단원 (두 집단 간 차이에 대한 두 개의 표본 추론) 1. 두 집단 간 차이에 대한 두 개의 표본 추론1-1. 두 비율 비교하기▶ 모비율 비교하기Sampling dist of P1 - P2P1 - P2 통계량 분포의 평균HTML 삽입미리보기할 수 없는 소스 P1 - P2 통계량 분포의 표준편차HTML 삽입미리보기할 수 없는 소스 신뢰구간 : 해당 구간 안에 실제 평균, 혹은 실제 P1 - P2 값을 추론하는표본에서 얻은 P1 - P2 값이 어떤 범위 d 안에 있다는 것신뢰구간 95% 의 경우,95%의 확률로 비율의 차 P1 - P2의 실제 값이 표본 비율로부터 ±d (= z값*표본표준편차) 안에 있다는 것 ▶ 모비율을 비교하는 가설검정Ho : P1 - P2 = 0 , P1 = P2H1 : P1 - P2 ≠ 0 , P1 ≠ P2ex. 유의수준 5% 하에서 H..
썸네일 통계학 Khan Academy | 11~12단원 (신뢰구간, 유의성 검정) 1. 11단원1-1. 신뢰구간이란?관심있는 모수에 대한 타당한 값의 범위반복되는 표본에서 이러한 구간들을 장기적으로 포착한 비율 ▶ 신뢰구간과 오차범위 [구하는 법](1) 모집단 전체를 조사할 수가 없으니 모집단 전체 중 일부 표본을 추출해 (n 만큼 추출)추출된 표본으로부터 통계량을 계산하고이를 이용해 알아내고자 하는 것을 계산(2) 표본통계량의 표본분포 (각 표본으로부터 얻을 수 있는 모든 가능한 표본 통계량들의 분포) 확인하기표본 통계량의 표본분포의 표준편차 HTML 삽입미리보기할 수 없는 소스(3) (모수를 정확히 알 수 없기 때문에) 한 표본 통계량이 표본 통계량의 표본분포 내에 어느 위치에 있게될지 알 수 없음구한 표본 통계량이 모집단의 분포에서 표준편차 두 배(2σ) 내에 있을 확률이 95%..
썸네일 통계학 Khan Academy | 9~10단원 (확률변수, 기하변수, 베르누이 분포, 푸아송 분포, 표본분포) 1. 9단원1-1. 확률 변수랜덤 프로세스를 통해 나온 확률값P(X >= 5) 이산확률변수연속확률변수 ▶ 확률변수에 대한 확률분포 만들기(예시 문제) 화요일에 눈이 올 확률P(화요일의 눈 높이)표본공간 = {8, 10, 12, 14}*표본공간 : 일어날 수 있는 모든 경우의 집합P(두 번 다 눈 옴 X =  10 + 2.5 + 1.5 = 14)  = 0.5 * 0.5 = 0.25P(월욜 눈 옴, 화욜 눈 안옴 X = 10 + 2.5 - 0.5 = 12) = 0.5 * 0.5 = 0.25P(월욜 눈 안옴, 화욜 눈 옴 X = 10 - 1.5 + 1.5 = 10) =  0.5 * 0.5 = 0.25P(월욜 눈 안옴, 화욜 눈 안옴 X = 10 - 1.5 - 0.5 = 8) = 0.5 * 0.5 = 0.25 ..
썸네일 통계학 Khan Academy | 7~8단원 (이론적 확률 vs. 통계적 확률, 순열과 조합) 1. 7단원1-1. 이론적 확률 기본▶ 이론적 확률이란?= 특정 사건이 일어날 경우의 수   / 총 경우의 수 (of equally likely possibilites) ▶ 간단한 확률문제노란색 구슬P(노랑색 구슬 뽑기) = 노랑색 구슬 수 / 총 경우의 수파란색 구슬P(파랑색이 아닌 구슬 뽑기)  = 총 구슬 수 - 파랑색 구슬 수 / 총 경우의 수 1-2. 집합 연산 기초A - B = A \ B B - A = B \ AA의 여집합 = U - A = U \ A 1-3. 통계적 확률▶ 실험적, 이론적 확률 시뮬레이션https://digfir-published.macmillanusa.com/stats_applet/stats_applet_10_prob.html ProbabilityIntroduction Se..
썸네일 통계학 Khan Academy | 확률과 통계 4~6단원 (자료분포 모델링, 연구방법론) 1. 4단원 : 자료분포 모델링▶ z-score평균이 표준편차의 몇 배가 떨어져 있는지를 나타냄평균과 해당 값의 간격이 표준편차의 몇 배인지HTML 삽입미리보기할 수 없는 소스 (예시) z = -2.3 : 평균이 표준편차 -2.3만큼 떨어져있음z = 1.5 : 평균이 표준편차 1.5만큼 떨어져있음  ▶ 정규분포와 경험법칙68% - 95% - 99.7% (문제) 역사 시험 점수  ▶ 분포의 이동, 변화중심경향치(평균, 중앙값) 는 상수를 사칙연산(+, -, *, /) 하면 분포가 이동하거나 변함+, - : 분포의 중심경향치가 더하고 뺀 만큼 늘어남 (단, 분포 변화는 없음)*,  / :  분포의 중심경향치가 곱하고 나눈만큼 커지고, 작아짐 (분포 변화 있음)산포도(표준편차, IQR, 범위) 는 상수를 + ..