일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 수업기록
- 판다스데이터분석
- 주피터노트북그래프
- SQLSCOTT
- 파이썬데이터분석
- 파이썬크롤링
- 주피터노트북데이터분석
- SQL수업
- sql따라하기
- python데이터분석
- 주피터노트북맷플롯립
- Python
- 팀플기록
- 파이썬수업
- 파이썬차트
- matplotlib
- python알고리즘
- 파이썬
- 데이터분석시각화
- 판다스그래프
- 주피터노트북판다스
- 주피터노트북
- sql연습하기
- python수업
- 맷플롯립
- 파이썬알고리즘
- 파이썬데이터분석주피터노트북
- SQL
- sql연습
- 파이썬시각화
- Today
- Total
목록전체 글 (191)
IT_developers
탐색적 데이터 분석 데이터 분석이라는 것이 특별히 정해진 규칙은 없음 기본적 작업 데이터 출처와 주제에 대한 이해 데이터 구성요소, 속성 확인 평균, 중앙값... 통계 요약 정보 출생아 수 합계 출산율 데이터 분석 https://www.index.go.kr/potal/main/EachDtlPageDetail.do?idx_cd=1428 엑셀 다운로드 (경로 : data/dataset) 저장된 파일 확인 1. 기본 설정 2. 데이터 로드 3. 데이터 정리 4. 데이터 전처리 5. 정리된 데이터 확인 6. 시각화 1) 행/열 변경 df.T df.transpose() 2) 선 그래프 3) 오른쪽 축 설정 excel에서의 z축 4) 출생아수 - 막대, 합계 출산율 - 라인 5) 그래프 디자인
탐색적 데이터 분석 데이터 분석이라는 것이 특별히 정해진 규칙은 없음 기본적 작업 데이터 출처와 주제에 대한 이해 데이터 구성요소, 속성 확인 평균, 중앙값... 통계 요약 정보 행정 안전부에서 2012년 2022년 데이터를 다운로드 후 데이터 분석 data_analytics -> project -> 인구현황 연령별 인구 현황.ipynb 10년 전 인구 변화 엑셀 다운로드 data_analytics -> data -> dataset 저장 201205_201205_연령별인구현황_월간.xlsx 데이터 기본 정보 확인 남자와 여자 컬럼명 불일치 데이터 전처리 : 데이터 수정 에러 문구 ValueError: cannot convert float NaN to integer 피라미드 차트 그리기 라이브러리 한글처리..
1. 라이브러리 로드 2. 한글설정 3. 데이터 프레임생성 1) 영화 데이터를 활용하여 x축은 영화, y축은 평점인 막대 차트 작성 2) 앞에서 작성한 막대 그래프에 제시된 세부 사항을 적용 제목 : 국내 Top10 영화 평점 정보 x축 label : 영화(90도 회전) y축 label : 평점 3) 개봉 연도별 평점 변화 추이를 꺽은선 로 작성 연도별 평균 데이터를 구한 후 그래프 작성 4) 앞에서 만든 그래프에 제시된 세부사항 적용 marker : 'o' x축 눈금 : 5년단뒤(2005,2010,2015,2020) y축 범위 : 최소 7, 최대 10 5) 평점이 9점 이상인 영화의 비율을 확인 할 수 있는 원 그래프를 작성 후 세부사항 적용 label : 9점이상/ 9점 미만 퍼센트 : 소수점 첫째 ..
matplotlib 기본 세팅 라이브러리 : import matplotlib.pyplot as plt 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 데이터 가져오기 차트 알아보기 : subplots() 여러 개의 차트 만들기 1) 차트 만들기 2) 첫번째 차트 만들기 axes[0,0] 3) 두번째 차트 만들기 axes[0,1] 4) 세번째 차트 만들기 axes[1,0] 5) 네번째 차트 그리기 axes[1,1] 6) 정리 # 전체 제목 지정 fig, axes = plt.subplots(2,2, figsize=(15,10)) fig.suptitle("여러 개의 그래프") # 첫번째 그래..
matplotlib 기본 세팅 라이브러리 : import matplotlib.pyplot as plt 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 데이터 가져오기 산점도 차트(scatter) x,y 상관관계를 나타낼 때 사용 1) 학년 컬럼 추가 : [3,3,2,1,1,3,2,2] 2) 기본 산점도 차트 3) 원 크기 변경 - 랜덤 값 s 이용 4) 원크기 변경 - 학년 별 5) 색상 변경 cmap : 팔레트 ※ 컬러 구별 6) 투명도 : alpha 7) colorbar() ticks : 기본으로 나오는 눈금 대신 다른 것 지정 label : 컬러바 라벨 지정 shrink : 컬러바..
matplotlib 기본 세팅 라이브러리 : import matplotlib.pyplot as plt 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 원 차트 autopct : 원 안에 표시할 % 포맷 startangle : 안 주는 경우 오른쪽 15도 정도에서 시작해서 시계 반대 방향으로 원이 돌아가게 됨, 각도를 주게 되면 그 각도를 기준으로 시계 반대 방향으로 원이 그려짐 counterclock=False : 시계 방향으로 원이 작성되도록 함 1) 기본 형태 만들기 2) 점유율 : autopct 3) 시작 각도 지정 돌아가는 방향은 반시계 방향 4) 돌아가는 방향 지정 가능 : c..
matplotlib 기본 세팅 라이브러리 : import matplotlib.pyplot as plt 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 데이터 불러오기 1. 다중 막대를 그리기 위한 개념 1) x 축을 위한 누금 수 정하기 2) 막대가 그려지는 가운데 위치를 기준으로 -0.25, 0, 0.25 처리 위처럼 그리면 막대가 겹치게 되니깐 막대의 너비를 조절해야 함 3) 범례 4) 타이틀, 범례, x축 변경