일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 맷플롯립
- 파이썬
- 파이썬알고리즘
- 주피터노트북맷플롯립
- 주피터노트북그래프
- python알고리즘
- python수업
- SQL수업
- matplotlib
- 주피터노트북
- 파이썬크롤링
- Python
- 주피터노트북판다스
- 판다스데이터분석
- 파이썬차트
- 팀플기록
- sql연습하기
- 파이썬데이터분석주피터노트북
- 파이썬데이터분석
- 데이터분석시각화
- 판다스그래프
- SQL
- 파이썬수업
- sql따라하기
- 파이썬시각화
- 주피터노트북데이터분석
- SQLSCOTT
- python데이터분석
- 수업기록
- sql연습
- Today
- Total
목록파이썬데이터분석 (68)
IT_developers

데이터 수집 서울 열린 데이터 광장 홈페이지 서울시 주민등록인구(구별) 통계 서울시 자치구 년도별 CCTV 설치현황 서울시 5대 범죄 발생현황 통계 구별 인구 통계 : https://data.seoul.go.kr/dataList/419/S/2/datasetView.do cctv : https://data.seoul.go.kr/dataList/OA-2734/F/1/datasetView.do 서울시 5대범죄 : https://data.seoul.go.kr/dataList/316/S/2/datasetView.do 라이브러리 및 세팅 import seaborn as sns seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함 sns.set(font_scale=1) import pandas as pd impo..

https://jumin.mois.go.kr/ageStatMonth.do 202206_202206_연령별인구현황_월간.csv 다운 라이브러리 import pandas as pd 경고메세지 지우기 import warnings warnings.simplefilter("ignore") import matplotlib.pyplot as plt 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 1. 데이터 로드 인코딩 에러 ==> encoding='cp949' UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 1: inval..

파일 설치 아나콘다 프롬프트 관리자모드 실행 pip install pandas-profiling[notebook] 오류 발생시 pip install markupsafe==2.0.1 라이브러리 from pandas_profiling import ProfileReport import numpy as np import pandas as pd import seaborn as sns 문서화 시키기 HTML 파일 만들기 http://localhost:8888/view/data_analytics/visualization/pandas/iris_report.html

pie plot(원 그래프) NaN이 있으면 0으로 채워짐 음수값이 있으면 오류 발생 기본 라이브러리 import pandas as pd import matplotlib.pyplot as plt import numpy as np 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 1) 기본 원 그래프 Name값이 y축 2) 에러 컬럼이 여러개 일 때 기준을 줘야함 ValueError: pie requires either y column or 'subplots=True' 3) 컬럼명 지정 4) 옵션 subplots = True : 컬럼별로 그래프를 그려줌 figsize : 그래프 크기 조절 ..

scatter plot(산점도) 데이터 분포도, 데이터 사이의 연관관계등을 살펴볼때 주로 사용 기본 라이브러리 import pandas as pd import matplotlib.pyplot as plt import numpy as np 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 1) 산점도 차트 scatter(x축, y축) s : 점의 크기(size) 2) 두 그룹 연관 관계 3) C 컬럼 4) 특정 컬럼을 이용해서 크기 조절

area plot(면적 그래프) NaN 값이 있으면 자동으로 0으로 채워짐 기본값으로 누적시켜서 작성됨 기본 라이브러리 import pandas as pd import matplotlib.pyplot as plt import numpy as np 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 기본 그래프 stacked = True : 기본 stacked = False : 겹치지 않음 grid = True : 그리드 옵션

Box plot(상자 ) 백분위 수 : 데이터를 백등분 한 것 사분위 수 : 데이터를 4등분 한 것 중위수 : 데이터의 정 가운데 순위에 해당하는 값.(관측치의 절반은 크거나 같고 나머지 절반은 작거나 같다.) 제 3사분위 수 (Q3) : 중앙값 기준으로 상위 50% 중의 중앙값, 전체 데이터 중 상위 25%에 해당하는 값 제 1사분위 수 (Q1) : 중앙값 기준으로 하위 50% 중의 중앙값, 전체 데이터 중 하위 25%에 해당하는 값 사분위 범위 수(IQR) : 데이터의 중간 50% (Q3 - Q1) 기본 라이브러리 import pandas as pd import matplotlib.pyplot as plt import numpy as np 한글처리 plt.rcParams['font.family'] =..

기본 라이브러리 import pandas as pd import matplotlib.pyplot as plt import numpy as np 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 1~100까지 랜덤 50개 숫자 데이터 생성 1) 기본 히스토그램 hist() kind='hist' 기본 구간 10 bins : 구간 변경 1000개 데이터 생성 2) 히스토그램 옵션 주기 alpha : 투명도 bins : 구간 stacked : 쌓기 orientation='horizontal' :옆으로 그리기 데이터 생성 3) 그룹별 히스토그램 카테고리가 구현 되어 있을 때 알아서 그려짐. plo..