Python 데이터 분석(주피터노트북) - Pandas(Subset-row and columns)(3)

Python

Python 데이터 분석(주피터노트북) - Pandas(Subset-row and columns)(3)

developers developing 2022. 10. 26. 12:00

rows, columns 기준

loc[ ]
- 5 또는 a 와 같은 단일 라벨
- ['a','b','c']와 같은 리스트나 라벨의 배열
- a:f 와 같이 라벨이 있는 처음과 끝의 범위를 포함하는 슬라이스 객체
- [True, False, True]와 같이 슬라이싱할 축과 같은 길이의 불리언 배열
- 호출하는 시리즈나 데이터 프레임을 인수로 가지는 호출 함수
iloc[ ]
- 정수
- [4,3,0] 과 같은 리스트나 정수들의 배열
- 1:7 과 같은 정숫값을 가지는 슬라이스 객체
- 불리언 배열
- 호출하는 시리즈나 데이터프레임을 인수로 가지는 호출 함수

1) df.iloc[ ] : 행, 열 모두 position 값을 이용(integer 값)

2) df.loc[ ] : 행, 열의 label 값을 이용하거나, boolean 이용/ 마지막 값 포함

※ total 연습

3) filter(items=None, like=None, regex=None, axis=None)

행 또는 열의 부분 집합 지정
정규식 표현 사용도 가능

[실습] friend_df

1) loc : 2번 인덱스 레이블 이용

2) 0,2번 인덱스 레이블 이용

3) 0,2번 행을 대상으로 name, job 컬럼만 가져오기

4) iloc : 0번행 가져오기

5) iloc : 1번 행의 0번 컬럼의 값 가져오기

6) iloc : 0,1번 행 가져오기

7) iloc : 0,1번 행의 0번 컬럼 가져오기

8) iloc : 0,1번 행의 0,1 컬럼 가져오기

9) iloc : 특정 값 수정 - Nate --> Torres

10) loc : 행추가 [Mike, 28, student]

11) filter 이용

name, job 컬럼
name
컬럼명에 a가 들어간 컬럼 추출
인덱스가 0으로 끝나는 행 추출

저작자표시 비영리 변경금지 (새창열림)