Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 팀플기록
- 파이썬차트
- Python
- sql연습
- matplotlib
- SQLSCOTT
- 판다스데이터분석
- 파이썬데이터분석
- 파이썬
- 수업기록
- python데이터분석
- SQL수업
- 주피터노트북
- 파이썬시각화
- 주피터노트북그래프
- 파이썬데이터분석주피터노트북
- 맷플롯립
- 주피터노트북맷플롯립
- sql따라하기
- 데이터분석시각화
- 주피터노트북데이터분석
- python알고리즘
- 파이썬수업
- 파이썬알고리즘
- 주피터노트북판다스
- sql연습하기
- 파이썬크롤링
- 판다스그래프
- python수업
- SQL
Archives
- Today
- Total
IT_developers
Python 데이터 분석(주피터노트북) - 스타워즈 데이터 분석 본문
라이브러리 로드
- import pandas as pd
- 경고메세지 지우기
- import warnings
- warnings.simplefilter("ignore")
- import matplotlib.pyplot as plt
- 한글처리
- plt.rcParams['font.family'] = 'Malgun Gothic'
- plt.rcParams['axes.unicode_minus'] = False
- import seaborn as sns
데이터 로드

데이터 탐색
- 전체정보 확인 : info()

데이터 값 정리
- 총 87개의 행
- 값이 비어있는 값들 확인 == NaN 값
- name : 캐릭터 이름
- height : 키
- mass : 몸무게
- hair_color : 머리카락 색
- sink_color : 피부색
- eye_color : 눈동자 색
- birth_year : 생년
- sex : 생물학적 성별
- gender : 생물학적 성별(외계인이기 때문에 제 3의성)
- homeworld : 고향
- species : 종
- 범주형 변수 : 빈도(Frequency) 계산
- name, hair_color, skin_color, sex, gender, homeworl, species
- 연속형 변수 : 수치 계산 가능
- height, mass, birth_year

1) 범주형 컬럼 안에 들어 있는 유니크한 값 확인

2) 어떤 컬럼에 NaN 값들이 있는지 확인
- 값을 채울지? 제거할지?

3) 총 데이터 갯수

4) 총 결측치 비율

5) 스타워즈에 등장하는 전체 인물 숫자

6) 스타워즈에 등장하는 종족 숫자

데이터 전처리

1) NaN 처리
- dropna : 지우기
- fillna : 채우기



EDA & Visualization
1) 스타워즈 캐릭터의 성별 비율 알아보기

1-1) 성별 pie plot

1-2) 성별 countplot

2) 스타워즈 캐릭터의 성별에 따른 신장의 분포 알아보기
- 왜도 : skew()
- 첨도 : kurt()

2-1) seaborn thistplot
kdeplot : 확률 분포

3) 가장 무거운 캐릭터와 가장 가벼운 캐릭터 알아보기

▶ 가장 가벼운 캐릭터 조건 (단, 0은 아님)




4) 스타워즈 캐릭터의 종족간 몸무게 비교
- 그룹잡기
- 그래프
- pandas


몸무게 많은 순으로 상위 10개 종족의 평균 몸무게 그래프 작성


5) 스타워즈 캐릭터의 몸무게 - 키 상관관계
- 제외 : 몸무게 == 1358,0
- regplot
- lmplot




'Python' 카테고리의 다른 글
Python 데이터 분석(주피터노트북) - 지하철 유,무임승차 데이터 분석(티머니) (0) | 2022.12.01 |
---|---|
Python 데이터 분석(주피터노트북) - 서울시 구별 CCTV 설치 대비 범죄율 데이터 분석 (0) | 2022.11.30 |
Python 데이터 분석(주피터노트북) - Seaborn(산점도) (0) | 2022.11.28 |
Python 데이터 분석(주피터노트북) - Seaborn(distribution plots) (0) | 2022.11.27 |
Python 데이터 분석(주피터노트북) - Seaborn(heatmap) (0) | 2022.11.27 |