머신러닝 기초 | 데이터 전처리 | train_test_split 함수 사용법 | 원본 데이터 비율에 맞게 훈련/테스트 데이터 나누는 법 | 표준점수로 기준 맞추는 법 | kneighbors() 메서드(가까운 이웃 찾기) | 산점..
1. 넘파이로 데이터 준비하기 ▶ 도미와 빙어 데이터 준비 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8, 10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 12.2, 12.4, 13.0, 14.3, 15.0] fish_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, ..
머신러닝 기초 | 지도 학습과 비지도 학습 | 훈련 세트와 테스트 세트 | 넘파이(Numpy) 배열로 샘플 섞는 방법 | fit() / score() / predict() 함수
1. 지도 학습과 비지도 학습 : 지도학습은 훈련하기 위한 데이터와 정답(타깃)이 필요함, 알고리즘이 정답을 맞히는 것을 학습 : 반면, 비지도 학습 알고리즘은 정답(타깃) 없이 특성(입력) 데이터만 사용 2. 훈련 세트와 테스트 세트 : 머신러닝 알고리즘의 성능을 제대로 평가하려면 훈련데이터와 평가에 사용할 데이터가 각각 달라야 함 : 가장 간단한 방법은 평가를 위해 또 다른 데이터를 준비하거나 이미 준비된 데이터 중에서 일부를 떼어 활용 : 훈련에 사용되는 데이터 → 훈련 세트 : 평가에 사용되는 데이터 → 테스트세트 ▶ 생선의 리스트 (길이, 무게) 입력 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, ..