'주피터노트북판다스' 태그의 글 목록 (4 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록주피터노트북판다스 (36)

IT_developers

Python 데이터 분석(주피터노트북) - Pandas(Combine-merge)

Merge merge(데이터프레임1, 데이터프레임2) : 두 데이터프레임에 동일한 이름을 가진 컬럼을 기준으로 두 데이터프레임을 합침 # 기본 방식처럼 했을 시 에러 : ValueError: You are trying to merge on int64 and object columns. If you wish to proceed you should use pd.concat ValueError: You are trying to merge on int64 and object columns. If you wish to proceed you should use pd.concat 1) how='조인기준', on='컬럼기준' how : inner 기본 # 동일한 타입 merge [실습] 1) df1, df2 inner..

Python 2022. 10. 31. 17:00

Python 데이터 분석(주피터노트북) - Pandas(Combine-concat)

Concat 두 데이터 프레임을 연결해서 하나의 데이터프레임으로 만들 수 있음 두 데이터 프레임을 위/아래 또는 왼쪽/오른쪽으로 연결하기만 함 pd.concat([데이터프레임1, 데이터프레임2]) [실습1] Series 데이터 [실습2] 데이터프레임 [실습3]

Python 2022. 10. 31. 09:00

Python 데이터 분석(주피터노트북) - Pandas(통계)

Summarize Data 1) value_counts() : unique 값들의 행 수 카운트 2) len() : 데이터프레임 안의 행의 개수 3) shape : 행, 열의 개수를 튜플로 4) unique() / nunique 5) describe() : 기술 통계 정보(분산, 최대, 최소, count, 표준편차, quantile) 6) info() : 데이터 프레임 전체 정보 7) sum() 8) count() : 전체 개수 9) mean() : 평균 10) median() : 중앙값 11) quantile() 12) max() 13) min() 14) var() 분산 15) std() : 표준편차 [실습] 1) train.xlsx 읽은 후 데이터 프레임 생성 2) 데이터프레임 전체 정보 3) 데이터..

Python 2022. 10. 30. 12:00

Python 데이터 분석(주피터노트북) - Pandas(NaN)

NaN(Not a Number) - 표현 불가능한 데이터(비어 있는 값) NaN : missing value 를 표현하는 기본 형태 기본적으로 float 형식으로 처리됨 NA(Not Available) : 결측값 None : 값의 부재(값이 존재하지 않거나, 없음, 정의되지 않음) 1) missing data가 포함된 데이터 프레임 생성 2) 데이터 타입 확인 3) missing data cjfl dropna : missing values 제거 fillna : missing values를 임의의 값으로 채우기 [실습] 1) shape : 행렬 형태를 알 수있고 튜플형태 2) info : 데이터프레임 전체 정보(행,열 수, 타입, 메모리 사용량..., NaN 여부) * 상식적으로 나이가 0인 것은 말이 안..

Python 2022. 10. 29. 12:00

Python 데이터 분석(주피터노트북) - Pandas(Logic in python)

& | ~ ^ df.any(), df.all() => 데이터프레임에서 사용시 and, or, not, xor, any, all => 파이썬에서 사용시 1) != : 아닌 2) isin() : 특정컬럼에 지정한 값이 들어 있는지 확인 3) isnull() : 널 값인지 확인 4) isin() : isnull()과 같은 결과 5) notnull() : 널 값이 아닌 요소 추출 6) any() : 특정 조건을 만족하는 것이 하나라도 있으면 True, 아니면 False 7) all() : 모든 원소가 특정 조건을 만족한다면 True, 아니면 False

Python 2022. 10. 28. 12:00

Python 데이터 분석(주피터노트북) - Pandas(Subset 실습)

[실습] student_df 1) loc 사용해서 2번행 가져오기 2) loc 사용해서 1번 행의 수학 점수 가져오기 3) loc 사용해서 전체행의 수학 점수 가져오기 4) 특정 행 조회 [실습] month_df 1) loc 사용해서 2월 행 가져오기 2) loc 사용해서 전체 행의 영어 컬럼 가져오기 3) loc 사용해서 2월 ~ 3월 행의 전체 컬럼 가져오기 4) iloc 사용해서 2월 ~ 3월 행의 전체 컬럼 가져오기 [실습] Subset 1. 라이브러리 로드 2. sample.xlsd 1) 데이터 프레임 생성 2) 앞 쪽의 5행 조회 3) 뒤 쪽의 3행 조회 4) 금월 컬럼에서 값이 큰 3개 행 조회 5) 전월 컬럼에서 값이 가장 작은 5개 행 조회 6) 총 판매수량이 250보다 큰 대리점 추출 ..

Python 2022. 10. 27. 12:00

Python 데이터 분석(주피터노트북) - Pandas(Subset-row and columns)(3)

rows, columns 기준 loc[ ] 5 또는 a 와 같은 단일 라벨 ['a','b','c']와 같은 리스트나 라벨의 배열 a:f 와 같이 라벨이 있는 처음과 끝의 범위를 포함하는 슬라이스 객체 [True, False, True]와 같이 슬라이싱할 축과 같은 길이의 불리언 배열 호출하는 시리즈나 데이터 프레임을 인수로 가지는 호출 함수 iloc[ ] 정수 [4,3,0] 과 같은 리스트나 정수들의 배열 1:7 과 같은 정숫값을 가지는 슬라이스 객체 불리언 배열 호출하는 시리즈나 데이터프레임을 인수로 가지는 호출 함수 1) df.iloc[ ] : 행, 열 모두 position 값을 이용(integer 값) 2) df.loc[ ] : 행, 열의 label 값을 이용하거나, boolean 이용/ 마지막 값..

Python 2022. 10. 26. 12:00

Python 데이터 분석(주피터노트북) - Pandas(Subset-columns)(2)

Subset - columns 라이브러리 import pandas as pd import numpy as np [실습] student_df

Python 2022. 10. 25. 12:00

Prev 1 2 3 4 5 Next

목록주피터노트북판다스 (36)

IT_developers

티스토리툴바