IT_developers

Python 데이터 분석(주피터노트북) - Pandas(텍스트 데이터 가공) 본문

Python

Python 데이터 분석(주피터노트북) - Pandas(텍스트 데이터 가공)

developers developing 2022. 11. 7. 12:00

str 메소드

  • pandas.core.strings.StringMethods 의 별칭
  • 호출할 수 없기 때문에 괄호를 사용하지 않음

 

1) lower() / upper() / len()

 

2) strip() : 공백제거

 

3) split() : 문자열 자르기

4) replace() : 대체. 정규식 사용 가능

  • ^는 입력라인의 시작
  • .a 는 맨 첫 문자를 포함하고 a로 끝나는 부분을 매칭
  • | or 의 의미
  • dog에 해당하는 부분 매칭
  • case=False 대소문자 구분 안함
  • regex=True 전달된 패턴이 정규식

5) cat : 텍스트 이어 붙이기

  • 손실값이 있다면 연결 안함

 

[실습] 일기 형식의 데이터 가공

  • split() : 기준을 주지 않으면 공백 기준
  • len : 문자열의 수 파악
  • contains() : 특정 문자열을 가지고 있는지 확인
  • count() : 숫자가 몇개 있는지 확인
  • findall() : 매칭되는 부분을 리스트로 출력
    • 패턴만들기 :(\d\d):(\d\d)

Comments