IT_developers

Python 데이터 분석(주피터노트북) - 동네 인구 구조 데이터 분석 본문

Python

Python 데이터 분석(주피터노트북) - 동네 인구 구조 데이터 분석

developers developing 2022. 11. 25. 13:00

https://jumin.mois.go.kr/ageStatMonth.do

202206_202206_연령별인구현황_월간.csv 다운

 

라이브러리

  • import pandas as pd
  • 경고메세지 지우기
    • import warnings
    • warnings.simplefilter("ignore")
  • import matplotlib.pyplot as plt
  • 한글처리
    • plt.rcParams['font.family'] = 'Malgun Gothic'
    • plt.rcParams['axes.unicode_minus'] = False

 

1. 데이터 로드

인코딩 에러 ==> encoding='cp949'

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 1: invalid continuation byte

 

1) 파일 정보 확인

2) , 제거하고 로드

3) int 값 확인 

 

2. 데이터 탐색

  • 행렬 조회
  • 수치형 데이터 조회
  • object 데이터 조회
  • NaN 개수 조회

 

3. 데이터 전처리

  • 필요없는 컬럼제거
  • 컬럼명 변경

1) 필요없는 컬럼 제거

  • 총 인구수
  • 연령 구간 인구수

 

2) 컬럼명 변경

  • 2022년 6월_계_  : 제거
  • rename()
    • rename(columns={"원본" : "변경"})
    • 새로 담거나, inplace=True 필요
  • columns[]
    • columns[바꿀 컬럼 나열]
    • 기본 inplace=True
  • replace()
    • columns.str.replace("원본","바꿀 내용")

  • 2022년 6월_계_  : 제거

 

 

1> 종로구 평창동 인구 구조

  • 1) 종로구 평창동 찾기
  • 2) 평창동 df에서 행정구역 컬럼 제거
  • 3) 선 그래프 
    • matplotlib
    • pandas
  • 4) 막대 그래프
    • matplotlib
    • pandas
  •  5) 수평 그래프
    • matplotlib
    • pandas

 

1) 종로구 평창동 찾기

▶ 컬럼일 때

 

1-1) 인덱스 일 때 평창동 찾기

  • 행정 구역을 인덱스로 설정

 

1-2) 행정구역 인덱스 해제

 

2) 평창동 df에서 행정구역 컬럼제거

  • 행/열 변경
  • 컬럼명 변경

 

3) 선차트

  • matplotlib
  • pandas

 

4) 막대차트

  • matplotlib
  • pandas

 

5) 수평 막대

  • matplotlib
  • pandas

 

2> 우리동네 인구 구조 알아보기

1) 사용자로부터 동네 입력받기

2) 사용자가 입력한 동을 찾아 새로운 데이터 프레임으로 생성

3) 데이터 전처리

  • 인덱스
  • 행렬 변경
  • 컬럼명 변경

4) 시각화

  • 막대그래프
    • matplotlib
    • pandas
  • 원 그래프
    • matplotlib

 

1) 사용자로부터 동네 입력받기

  • input('문구')

 

2) 사용자가 입력한 동을 찾아 새로운 데이터 프레임 생성

 

3) 데이터 전처리

  • 인덱스 변경 : set_index
  • 행렬 변경 : .T 
  • 컬럼명 변경 : .columns

 

4) 시각화

  • 막대 그래프
  • 원 그래프

막대 그래프

 

원 그래프

Comments