IT_developers

Python 데이터 분석(주피터노트북) - Pandas(Subset-row and columns)(3) 본문

Python

Python 데이터 분석(주피터노트북) - Pandas(Subset-row and columns)(3)

developers developing 2022. 10. 26. 12:00

rows, columns 기준

  • loc[ ]
    • 5 또는 a 와 같은 단일 라벨
    • ['a','b','c']와 같은 리스트나 라벨의 배열
    • a:f 와 같이 라벨이 있는 처음과 끝의 범위를 포함하는 슬라이스 객체
    • [True, False, True]와 같이 슬라이싱할 축과 같은 길이의 불리언 배열
    • 호출하는 시리즈나 데이터 프레임을 인수로 가지는 호출 함수
  • iloc[ ]
    • 정수
    • [4,3,0] 과 같은 리스트나 정수들의 배열
    • 1:7 과 같은 정숫값을 가지는 슬라이스 객체
    • 불리언 배열
    • 호출하는 시리즈나 데이터프레임을 인수로 가지는 호출 함수

 

1) df.iloc[ ] : 행, 열 모두 position 값을 이용(integer 값)

 

2) df.loc[ ] : 행, 열의 label 값을 이용하거나, boolean 이용/ 마지막 값 포함

 

※  total 연습

3) filter(items=None, like=None, regex=None, axis=None)

  • 행 또는 열의 부분 집합 지정
  • 정규식 표현 사용도 가능

 

[실습] friend_df

1) loc : 2번 인덱스 레이블 이용

2) 0,2번 인덱스 레이블 이용

3) 0,2번 행을 대상으로 name, job 컬럼만 가져오기

4) iloc : 0번행 가져오기

5) iloc : 1번 행의 0번 컬럼의 값 가져오기

6) iloc : 0,1번 행 가져오기

7) iloc : 0,1번 행의 0번 컬럼 가져오기

8) iloc : 0,1번 행의 0,1 컬럼 가져오기

9) iloc : 특정 값 수정 - Nate --> Torres

10) loc : 행추가 [Mike, 28, student]

11) filter 이용

  • name, job 컬럼
  • name
  • 컬럼명에 a가 들어간 컬럼 추출
  • 인덱스가 0으로 끝나는 행 추출

Comments