데이터 분석 기초 | Matplotlib 데이터 시각화 | 라인 그래프, 히스토그램, 막대그래프, 산점도, 박스플롯 그리기 | 옵션 사용자화 방법(색 변경, 범례 설정, 선 스타일, 그리드, 타이틀 설정 등)
1. Matplotlib 데이터 시각화 ▶ Matplotlib 라이브러리 : 저수준의 그래픽용 라이브러리 ▶ 참고 사이트 https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.subplots.html matplotlib.pyplot.subplots — Matplotlib 3.7.1 documentation ax can be either a single Axes object, or an array of Axes objects if more than one subplot was created. The dimensions of the resulting array can be controlled with the squeeze keyword, see above..
데이터 분석 기초 | 데이터 병합 후 처리 | 중복 데이터 확인(duplicated 함수, keep / keep_equal / keep_shape / align(axis = ) / all(axis = 1)) | 중복 데이터 삭제(drop_duplicates 함수) | 데이터 비교(compare 함수 / eq..
1. 데이터 병합 후 처리 : 데이터 병합 또는 재형성을 한 뒤에도 이상적인 모습으로 정리되지 않은 경우 처리하는 방법 ▶ 라이브러리 설치 및 가져오기 import pandas as pd import numpy as np 2. 합친 데이터에서 중복 행 확인, 삭제하기 : 2개 이상의 데이터를 합쳤을 때 생기는 중복데이터를 파악하고, 삭제 : 중복 데이터란, 모든 열의 값이 동일한 행을 의미 : 중복 행 유무는 deplicated() 함수로 확인 2-1) 중복 행 확인하기 * data_d 만들기 data_d = pd.DataFrame({ '패션아이템' : ['팬츠', '팬츠', '자켓', '자켓', '자켓'], '스타일' : ['캐주얼', '캐주얼', '캐주얼', '비즈니스룩', '비즈니스룩'], '선호도..
데이터분석 기초 | 데이터 재형성 / 재배치(피벗) | stack, unstack 함수 | pivot 함수 개념 | melt 함수 개념 | id_vars , value_vars | var_name , value_name | 복합 개체 분리 explode 함수
1. 데이터 재형성과 피벗 : 테이블 형식의 데이터는 다양한 방식과 기준으로 데이터를 재배치(피벗)하는 것이 가능 : 판다스에 이러한 연산이 가능한 함수 있음 ▶ 라이브러리 설치 및 가져오기 import pandas as pd import numpy as np 2. 열을 인덱스로 교환하기 : 열을 인덱스로 교환하여 데이터를 재배치(피벗)할 수 있음 : stack()과 unstack() 함수 사용 ▶ coffee_size_data 만들기 coffee_size_data = pd.DataFrame([[10, 28], [8, 22]], index = ['스타벅스', '커피빈'], columns = ['테이블 수', '매장 규모(평)']) coffee_size_data ▶ .stack( ) / .unstack( ..
데이터 분석 기초 | 데이터 상하/좌우 병합 | concat 함수 | append 함수 | merge 함수 | join 함수 | suffix, lsuffix, rsuffix 사용법 | combine_first 함수
1. 데이터 병합 ▶ 판다스_데이터 병합 : 판다스에 있는 함수를 이용해 흩어져 있는 데이터를 연결하고 병합 : 판다스의 시리즈, 데이터프레임같은 객체의 내부는 축마다 이름이 있기 때문에 쉽게 병합 가능 : concat() 함수와 append() 함수 이용 ▶ 라이브러리 설치 및 가져오기 import pandas as pd import numpy as np 2. 데이터 상·하로 병합하기 2-1) concat() ▶ menu1과 menu2라는 2개의 시리즈를 하나의 시리즈로 병합 menu1 = pd.Series(['파스타', '라면', '냉면'], index = [1, 2, 3]) menu2 = pd.Series(['돈가스', '피자', '치킨'], index = [4, 5, 6]) pd.concat([m..