머신러닝 | 로지스틱 회귀(Logistic Regression) 모델 | 모델 평가지표 (Accuracy, F1-score) | 지도학습 | 분류분석(Y변수가 범주형 데이터일 때 사용 1. 선형회귀와 로지스틱 회귀 비교 ▶ 선형회귀와 로지스틱 회귀의 공통점 모델 생성이 쉬움 가중치(혹은 회귀계수)를 통한 해석이 쉬운 장점이 있음 X변수에 범주형, 수치형 변수 둘 다 사용 가능 ▶ 선형회귀와 로지스틱 회귀의 차이점 선형회귀(회귀) 로지스틱 회귀(분류) Y(종속변수) 수치형 범주형 평가척도 Mean Squared Error R square(선형회귀의 경우만) Accuracy F1-score sklearn 모델 클래스 sklearn.linear_model.linearRegression sklearn.linear_model.LogistricRegression sklearn 평가 클래스 sklearn.metrics.mean_squared_error skelarn.metrics.r2_score .. 머신러닝 | 선형회귀 (Linear Regression) 실습 | tips 데이터 | 범주형 데이터 인코딩 (Encoding) 하는 방법 1. 라이브러리 가져오기 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns 2. tips 데이터셋 구경하기 ▶ tips 데이터셋 안의 데이터들은 어떻게 생겼는지 살펴보기 tips_df = sns.load_dataset('tips') tips_df.head() total_bill : 전체 결제 가격 tip : 팁 sex : 성별 smoker : 흡연 여부 day : 요일 time : 식사 시간대 size : 동반자 수 ▶ tips 데이터의 간략한 정보 살펴보기 tips_df.info() 결측치(null값)가 없는 각 244개의 데이터 수치형 데이터 : total_bill, tip, size 범주형 데이터 : sex, smok.. 머신러닝 | 다중선형회귀 | 범주형 데이터 인코딩(Encoding) 방법 [참고 게시글] [데이터분석 과정/머신러닝] - 머신러닝 | 선형회귀 (Linear Regression) 직선 구하는 방법 | 회귀분석 평가지표 (MSE, R Square) | 회귀분석 | 지도학습 머신러닝 | 선형회귀 (Linear Regression) 직선 구하는 방법 | 회귀분석 평가지표 (MSE, R Square) | 회귀분 1. 선형회귀 이론 ▶ 선형회귀 용어 정리 X는 독립변수, 원인변수, 설명변수 Y는 종속변수, 결과변수 ▶ 통계학에서 사용하는 선형회귀 식 β0 : 편향(Bias) β1 : 회귀 계수 ε : 오차(에러), 모델이 설 nasena.tistory.com 1. 다중선형회귀 ▶ 다중선형회귀 이전 게시글에서는 X와 Y간의 데이터를 단순 선형회귀 분석 했음 하지만 실제의 데이터들은 비선.. 머신러닝 | 선형회귀 (Linear Regression) | 모델 평가지표 (MSE, R Square) | 지도학습 | 회귀분석(Y변수가 수치형 데이터일 때 사용) 1. 선형회귀 이론 ▶ 선형회귀 용어 정리 X는 독립변수, 원인변수, 설명변수 Y는 종속변수, 결과변수 ▶ 통계학에서 사용하는 선형회귀 식 β0 : 편향(Bias) β1 : 회귀 계수 ε : 오차(에러), 모델이 설명하지 못하는 Y의 변동성 >> 수식 계산 방법 : 각 변수는 사실 행렬로 이루어진 값이라서 행렬 계산함 ▶ 머신러닝 / 딥러닝에서 사용하는 선형회귀 식 ω : 가중치 b : 편향(Bias) ▶ 두 수식의 의미 일차방정식 Y = aX+b 산재되어 있는 데이터 값들을 가장 잘 나타내주는 하나의 '직선'을 그리는 것 회귀 계수(혹은 가중치)의 값을 알면 X가 주어졌을 때 Y를 알 수 있음 2. 최적의 직선을 그리는 법 2-1) X와 Y 간의 상관관계 찾아내기 조사하고 싶은 X와 Y 결정하기 키(X.. 이전 1 다음