일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 파이썬데이터분석주피터노트북
- python수업
- 수업기록
- python알고리즘
- 맷플롯립
- 주피터노트북그래프
- 파이썬시각화
- SQL수업
- python데이터분석
- 파이썬차트
- sql연습하기
- 주피터노트북판다스
- 판다스그래프
- sql따라하기
- 팀플기록
- 파이썬알고리즘
- SQLSCOTT
- Python
- 판다스데이터분석
- 파이썬크롤링
- 파이썬
- matplotlib
- sql연습
- 파이썬수업
- SQL
- 주피터노트북데이터분석
- 파이썬데이터분석
- 주피터노트북
- 주피터노트북맷플롯립
- 데이터분석시각화
- Today
- Total
목록수업기록 (187)
IT_developers
Subset - row 라이브러리 import pandas as pd import numpy as np 데이터 생성 1) head() / tail() 2) sample() : 임의 값 가지고 오기 3) nlargest() / nsmallest() : 최대값, 최소값 n 값은 지정 가능 4) drop_duplicates() : 중복행 제거 duplicated() : 중복된 행이 있는지 True/False로 알려줌 df.drop_duplicates( subset: Union[Hashable, Sequence[Hashable], NoneType] = None, keep: Union[str, bool] = 'first', inplace: bool = False, ignore_index: bool = False,..
[실습1] 1) 라이브러리 로드 2) 아래와 같은 데이터 프레임 생성 3) 홍길동 학생의 과목별 점수 조회 4) 모든 학생들의 python 과목 점수 출력 5) basic 점수 삭제 6) sql 과목 점수 추가 : [70,85,86,92] [실습2] 1) 아래와 같은 데이터프레임 생성 2) 인덱스를 넣어서 아래와 같은 데이터 프레임생성 3) 인덱스 조회 4) 컬럼명 조회 5) 전체 값들만 조회 6) 미국 컬럼조회 7) 일본 컬럼 추가 : [3,4,5]
Pandas 개념 고수준의 자료구조와 파이썬에서 빠르고 쉽게 사용할 수 있는 데이터 분석 도구 포함 테이블 형 데이터를 다룰 수 있는 다양한 기능을 가진 라이브러리 파이썬 데이터 분석을 위해 기본적으로 사용하는 라이브러리임 row data를 데이터 분석 전 과정을 위해 사용할 수 있도록 변환하는 데이터 전처리에도 많이 사용됨 기능 인 메모리 데이터 구조를 가지며 여러 파일 형식 데이터를 읽고 쓰기 위한 도구 데이터 정렬, 손실 데이터를 통합 처리 데이터 셋을 reshaping, 피벗 라벨 기반 슬라이싱, 멀티인덱싱 제공 데이터 셋 merge, join 하기 편함 다양한 시계열 데이터 처리 가능 데이터 구조 시리즈(Series) : 라벨 표시된 1차원의 동일 형태 배열 데이터 프레임(DataFrame) :..
Pandas 개념 고수준의 자료구조와 파이썬에서 빠르고 쉽게 사용할 수 있는 데이터 분석 도구 포함 테이블 형 데이터를 다룰 수 있는 다양한 기능을 가진 라이브러리 파이썬 데이터 분석을 위해 기본적으로 사용하는 라이브러리임 row data를 데이터 분석 전 과정을 위해 사용할 수 있도록 변환하는 데이터 전처리에도 많이 사용됨 기능 인 메모리 데이터 구조를 가지며 여러 파일 형식 데이터를 읽고 쓰기 위한 도구 데이터 정렬, 손실 데이터를 통합 처리 데이터 셋을 reshaping, 피벗 라벨 기반 슬라이싱, 멀티인덱싱 제공 데이터 셋 merge, join 하기 편함 다양한 시계열 데이터 처리 가능 데이터 구조 시리즈(Series) : 라벨 표시된 1차원의 동일 형태 배열 데이터 프레임(DataFrame) :..
행렬 정렬 sort() : 기본 오름차순 정렬 np.sort(ndarray) : 원본은 변경하지 않음 ndarray.sort() : 원본이 변경됨 argsort() : 정렬된 후의 인덱스 찾기 1) 오름차순 sort() 2) 내림차순 [:: -1] 3) 행, 열, 축 기준으로 정렬 4) 인덱스 찾기 행렬 내적(행렬 곱) 전치 행렬 : 기존 행렬에서 행과 열 위치를 교환한 원소
브로드 캐스팅 (Broadcasting) 뒷 차원에서 부터 비교하여 Shape 같거나 차원 중 값이 1인 것이 존재하면 가능 확대해서 연산을 함 1) Shape이 같은 행렬 2) Shape이 다른 행렬 3) 에러 발생 : ValueError: operands could not be broadcast together with shapes (4,3) (4,) 열을 맞춰줘야 오류 없이 실행 실습 1) 서울의 한달 온도에 대한 데이터 생성 31개의 온도 데이터 20~32 사이의 데이터 생성 2) 기온이 25도를 넘는 날의 수 출력 3)기온이 25도를 넘는 날의 평균 기온
함수 기본함수 - 행렬 사칙연산 add(), subtract(), multiply(), divide() 통계함수 mean(), max(),var(),median(),std() 집계 함수 - 합계, 누적합계 1. 기본 함수 - 행렬 사칙연산 1) + , - 2) * , / 2. 통계 함수 1) mean() : 평균, max() : 최댓값 2) argmax() : 자리값 찾기 3) var() : 분산, median() : 중앙값, std() : 표준편차 3. 집계함수 1) sum() : 합계, cumsum() : 누적합계 4. axis : 축 방향 1) 1차원 2) 3차원 : 행, 열, 면
인덱싱 특정한 데이터 추출 : 원하는 위치의 인덱스 값 지정 슬라이싱(slicing) : 연속된 인덱싱 상의 ndarray 추출 팬시 인덱싱(Fancy Indexing) : 일정한 인덱싱 집합을 리스트로 또는 ndarray 형태로 지정해 해당 위치에 있는 데이터의 ndarray 반환 불린 인덱싱(Boolean Indexing) : 특정 조건에 해당하는지 여부인 True/False 값 인덱싱 집합을 기반으로 True에 해당하는 인덱스 위치에 있는 데이터의 ndarray 반환 1. 기본 개념 및 파이썬 복습 1) 1차원 2) 2차원 행렬 특정 요소의 접근을 원한다면 행렬로 가능 3) 3차원 행렬 2. 슬라이싱(slicing) : 연속된 인덱싱 상의 ndarray 추출 1) 1차원 2) 2차원 3. 팬시 인덱..