Python
Python 데이터 분석(주피터노트북) - Pandas(Subset-row and columns)(3)
developers developing
2022. 10. 26. 12:00

rows, columns 기준
- loc[ ]
- 5 또는 a 와 같은 단일 라벨
- ['a','b','c']와 같은 리스트나 라벨의 배열
- a:f 와 같이 라벨이 있는 처음과 끝의 범위를 포함하는 슬라이스 객체
- [True, False, True]와 같이 슬라이싱할 축과 같은 길이의 불리언 배열
- 호출하는 시리즈나 데이터 프레임을 인수로 가지는 호출 함수
- iloc[ ]
- 정수
- [4,3,0] 과 같은 리스트나 정수들의 배열
- 1:7 과 같은 정숫값을 가지는 슬라이스 객체
- 불리언 배열
- 호출하는 시리즈나 데이터프레임을 인수로 가지는 호출 함수

1) df.iloc[ ] : 행, 열 모두 position 값을 이용(integer 값)





2) df.loc[ ] : 행, 열의 label 값을 이용하거나, boolean 이용/ 마지막 값 포함




※ total 연습



3) filter(items=None, like=None, regex=None, axis=None)
- 행 또는 열의 부분 집합 지정
- 정규식 표현 사용도 가능






[실습] friend_df

1) loc : 2번 인덱스 레이블 이용
2) 0,2번 인덱스 레이블 이용
3) 0,2번 행을 대상으로 name, job 컬럼만 가져오기
4) iloc : 0번행 가져오기
5) iloc : 1번 행의 0번 컬럼의 값 가져오기
6) iloc : 0,1번 행 가져오기
7) iloc : 0,1번 행의 0번 컬럼 가져오기
8) iloc : 0,1번 행의 0,1 컬럼 가져오기
9) iloc : 특정 값 수정 - Nate --> Torres
10) loc : 행추가 [Mike, 28, student]
11) filter 이용
- name, job 컬럼
- name
- 컬럼명에 a가 들어간 컬럼 추출
- 인덱스가 0으로 끝나는 행 추출





