IT_developers

Python 데이터 분석(주피터노트북) - Pandas(NaN) 본문

Python

Python 데이터 분석(주피터노트북) - Pandas(NaN)

developers developing 2022. 10. 29. 12:00

NaN(Not a Number) - 표현 불가능한 데이터(비어 있는 값)

  • NaN : missing value 를 표현하는 기본 형태
  • 기본적으로 float 형식으로 처리됨

NA(Not Available) : 결측값

None :  값의 부재(값이 존재하지 않거나, 없음, 정의되지 않음)

 

 

1) missing data가 포함된 데이터 프레임 생성

2) 데이터 타입 확인

3) missing data cjfl

  • dropna : missing values 제거
  • fillna : missing values를 임의의 값으로 채우기

 

[실습] 

1) shape : 행렬 형태를 알 수있고 튜플형태

2) info : 데이터프레임 전체 정보(행,열 수, 타입, 메모리 사용량..., NaN 여부)

* 상식적으로 나이가 0인 것은 말이 안되니까 그럴듯하게 변경하기
* 선생님의 나이는 다른 선생님들 나이의 평균값으로, 학생들의 나이또한 평균값으로 변경하기

[실습] 

  • isna() : 결측치 확인
  • isnull() : 결측치 확인
  • fillna(0) : 결측치 0으로 채우기

Comments