Python
Python 데이터 분석(주피터노트북) - Pandas(텍스트 데이터 가공)
developers developing
2022. 11. 7. 12:00
str 메소드
- pandas.core.strings.StringMethods 의 별칭
- 호출할 수 없기 때문에 괄호를 사용하지 않음
1) lower() / upper() / len()
2) strip() : 공백제거
3) split() : 문자열 자르기
4) replace() : 대체. 정규식 사용 가능
- ^는 입력라인의 시작
- .a 는 맨 첫 문자를 포함하고 a로 끝나는 부분을 매칭
- | or 의 의미
- dog에 해당하는 부분 매칭
- case=False 대소문자 구분 안함
- regex=True 전달된 패턴이 정규식
5) cat : 텍스트 이어 붙이기
- 손실값이 있다면 연결 안함
[실습] 일기 형식의 데이터 가공
- split() : 기준을 주지 않으면 공백 기준
- len : 문자열의 수 파악
- contains() : 특정 문자열을 가지고 있는지 확인
- count() : 숫자가 몇개 있는지 확인
- findall() : 매칭되는 부분을 리스트로 출력
- 패턴만들기 :(\d\d):(\d\d)