안나세나 코딩 학습일지

썸네일 머신러닝 | 데이터 분리 | 데이터 훈련 시 과대적합을 피하기 위한 방법 | X_trian, X_test, y_train, y_test 1. 과대적합이란? ▶ 과대적합 : 한 데이터를 과도하게 학습하는 바람에 그 데이터 내의 예측 및 분류 문제만 잘 맞추고, 새로운 데이터를 가져오면 모델이 제대로 예측 또는 분류하지 못하는 현상을 말함 예측 또는 분류를 위해 모형 복잡도를 설정함 모형이 지나치게 복잡하면 → 과대 적합이 될 수 있음 모형이 지나치게 단순하면 → 과소 적합이 될 수 있음 ▶ 과대적합이 되는 이유(원인) 모델의 복잡도가 높은 경우 데이터의 양이 불충분한 경우 학습 반복이 많은 경우 (딥러닝) 데이터 비율이 불균형한 경우 (ex. A : B가 95 : 5인 경우) 2. 과대적합 해결방법 2-1) train / test 데이터로 나누기 ▶ 테스트 데이터의 분리 ▶ train / test 데이터 분리 학습 데이터 (Train Da..
이전 1 다음
프로필사진

기록하며 성장하는 데이터분석가 안나세나+1 입니다.

  • 분류 전체보기 (197)
    • AI기본과정 (35)
      • 파이썬 기초 (12)
      • 데이터분석 기초 (15)
      • AI, 머신러닝 기초 (8)
    • 데이터분석 과정 (68)
      • 내일배움캠프 (0)
      • SQL (23)
      • 파이썬 (1)
      • 데이터 분석 (27)
      • 머신러닝 (15)
      • 그로스 해킹 (2)
    • 코딩테스트 (57)
      • SQL 코드카타 (57)
      • 파이썬 코드카타 (0)
      • 개인 과제 (0)
    • 통계학, 인과추론 스터디 (20)
      • 확률과 통계 (6)
      • 선형 대수학 (8)
      • 인과추론 (6)
    • 공모전 (4)
      • 서울시 따릉이 관광 활성화 (3)
      • 천안시 빵소마을 최적 입지 선정 (1)
    • 기록+성장 (12)
  • 홈

인기글

최근글

최근댓글

라이브러리 브랜드 그룹 | 안나세나 코딩 학습일지
맨 위로

티스토리툴바