IT_developers

Python 데이터 분석(주피터노트북) - Pandas(box plot) 본문

Python

Python 데이터 분석(주피터노트북) - Pandas(box plot)

developers developing 2022. 11. 24. 09:00

Box plot(상자 )

  • 백분위 수 : 데이터를 백등분 한 것
  • 사분위 수 : 데이터를 4등분 한 것
  • 중위수 : 데이터의 정 가운데 순위에 해당하는 값.(관측치의 절반은 크거나 같고 나머지 절반은 작거나 같다.)
  • 제 3사분위 수 (Q3) : 중앙값 기준으로 상위 50% 중의 중앙값, 전체 데이터 중 상위 25%에 해당하는 값
  • 제 1사분위 수 (Q1) : 중앙값 기준으로 하위 50% 중의 중앙값, 전체 데이터 중 하위 25%에 해당하는 값
  • 사분위 범위 수(IQR) : 데이터의 중간 50% (Q3 - Q1)

 

기본 라이브러리

  • import pandas as pd
  • import matplotlib.pyplot as plt
  • import numpy as np
  • 한글처리
    • plt.rcParams['font.family'] = 'Malgun Gothic'
    • plt.rcParams['axes.unicode_minus'] = False 

 

10 개의 데이터 생성

 

1) 박스 그림 그리기

  • box()

 

2) 박스 그림 옵션

  • color 
    • boxes : 박스
    • whiskers : 수염
    • medians : 중앙값
    • caps : 양 끝
  • sym : 특수값
  • vert : 눕는 그래프

Comments