일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- 파이썬데이터분석주피터노트북
- 주피터노트북데이터분석
- 파이썬알고리즘
- 주피터노트북그래프
- SQLSCOTT
- python수업
- 수업기록
- 주피터노트북판다스
- matplotlib
- 주피터노트북
- 파이썬시각화
- 판다스데이터분석
- 파이썬차트
- 판다스그래프
- 주피터노트북맷플롯립
- Python
- SQL
- 파이썬데이터분석
- 데이터분석시각화
- sql연습
- 맷플롯립
- sql연습하기
- 팀플기록
- SQL수업
- 파이썬
- sql따라하기
- 파이썬수업
- python알고리즘
- 파이썬크롤링
- python데이터분석
- Today
- Total
목록전체 글 (191)
IT_developers

함수 기본함수 - 행렬 사칙연산 add(), subtract(), multiply(), divide() 통계함수 mean(), max(),var(),median(),std() 집계 함수 - 합계, 누적합계 1. 기본 함수 - 행렬 사칙연산 1) + , - 2) * , / 2. 통계 함수 1) mean() : 평균, max() : 최댓값 2) argmax() : 자리값 찾기 3) var() : 분산, median() : 중앙값, std() : 표준편차 3. 집계함수 1) sum() : 합계, cumsum() : 누적합계 4. axis : 축 방향 1) 1차원 2) 3차원 : 행, 열, 면

인덱싱 특정한 데이터 추출 : 원하는 위치의 인덱스 값 지정 슬라이싱(slicing) : 연속된 인덱싱 상의 ndarray 추출 팬시 인덱싱(Fancy Indexing) : 일정한 인덱싱 집합을 리스트로 또는 ndarray 형태로 지정해 해당 위치에 있는 데이터의 ndarray 반환 불린 인덱싱(Boolean Indexing) : 특정 조건에 해당하는지 여부인 True/False 값 인덱싱 집합을 기반으로 True에 해당하는 인덱스 위치에 있는 데이터의 ndarray 반환 1. 기본 개념 및 파이썬 복습 1) 1차원 2) 2차원 행렬 특정 요소의 접근을 원한다면 행렬로 가능 3) 3차원 행렬 2. 슬라이싱(slicing) : 연속된 인덱싱 상의 ndarray 추출 1) 1차원 2) 2차원 3. 팬시 인덱..

빅데이터 분석을 위한 파이썬 라이브러리 Numpy : 과학계산 및 수학계산 pandas : 데이터 처리 및 분석 matplotlib, seaborn : 데이터 시각화 plotly : 오픈 소스인 대화형의 고품질 도면 및 인터렉티브한 그래픽 라이브러리 SciPy : 신초 처리, 최적화, 과학 계산 및 통계 처리 BeautifulSoup : HTML과 XML 에서 정보를 수집 Scrapy : 웹 크롤링 및 데이터 수집 TensorFlow : 머신러닝 및 딥러닝 Keras : 신경망 라이브러리 및 딥러닝 NLTK : 자연어 처리 Numpy (Numerical Python) 파이썬의 수치 해석 프로그램인 Numeric 를 개선, 보완한 패키지 산술 계산을 위한 가장 중요한 필수 패키지 효율적인 다차원 배열인 n..

주피터 노트북 셀 단위로 파이썬 코드를 실행할 수 있는 도구 많이 사용 되는 도구 주피터 노트북을 온라인에서 사용 ==> 구글 Colab New - Python 3 클릭 새 파일 생성 Code : 코드를 입력할 수 있는 상태 Markdown : 주석으로 입력할 수 있는 상태 셀이 선택된 상태면 파란색 코드 입력 할 수 있는 상태면 초록색 단축키 Shift + Enter : 셀이 수행되고 새로운 셀 삽입 Ctrl + Enter : 셀 수행 A : 현재 셀 위에 셀 추가 B : 현재 셀 아래에 셀 추가 DD : 현재 셀 삭제 ESC + M : 코드에서 마크다운으로 변경됨 ESC : 초록색 화면에서 누르면 Tab : 자동완성 Shift + Tab : 설명을 볼수 있음 ex) np.zeros(( 커서 두고 ))..

아나콘다 통합 개발 환경 데이터 사이언스 - 빅데이터 분석 https://www.anaconda.com/==> 다운로드 Anaconda | The World's Most Popular Data Science Platform Anaconda is the birthplace of Python data science. We are a movement of data scientists, data-driven enterprises, and open source communities. www.anaconda.com 파이썬 데이터 분석을 하기 위해 주피터 노트북을 사용 할 예정 꼭, 아나콘다를 통해 들어올 필요 없음. ● 주피터 노트북 드라이브 경로 변경하기 기본 : C 드라이브 파일 위치 열기 - 설치된 폴더로 연..

1. TOP3 카테고리와 그 외 상품의 매출액 비교 SELECT item_type, SUM(gmv) AS gmv FROM ( SELECT CASE WHEN c.cate1 IN ( '스커트', '티셔츠', '원피스' ) THEN 'TOP3' ELSE '기타' END AS item_type, SUM(gmv) AS gmv FROM ordertbl o JOIN item i ON o.itemid = i.num JOIN category c ON i.category_id = c.num GROUP BY c.cate1, c.cate2, c.cate3 ORDER BY gmv DESC ) GROUP BY item_type; 2. 아이템 컨셉을 지정 후 추출 시크, 깜찍, 청순, 기본 키워드별 상품 분류 후 매출 조회 ord..

1. 남성이 구매하는 아이템 조회 남성인지 알수 있는 테이블 USERTBL - GENDER ORDERTBL - USERID 조인 1) 남성은 몇 명? SELECT COUNT(*) FROM usertbl WHERE gender = 'M'; 2) 남성이 구매한 아이템 아이디? 조회 (usertbl, ordertbl 테이블 조인) SELECT u.userid, o.itemid FROM usertbl u JOIN ordertbl o ON u.userid = o.userid WHERE u.gender = 'M'; 3) 7,20 아이템명과 매출액 조회 SELECT i.item_name, SUM(gmv) AS gmv FROM usertbl u JOIN ordertbl o ON u.userid = o.userid JO..

ORDERTBL 데이터 분석 orderTBL orderid 컬럼은 item id(num)와 일치 orderTBL userid 컬럼은 usertbl 의 userid와 일치 item category_id 컬럼은 category id(num) 와 일치 1. orderTBL 조회 SELECT * FROM ordertbl; 1) userid가 없는 주문 내역 조회 SELECT * FROM ordertbl WHERE userid IS NULL; 2) 아이템 테이블 조회 3) 상품별 매출액 집계 후 매출액 높은 순으로 정렬 SELECT itemid, SUM(gmv) AS gmv FROM ordertbl GROUP BY itemid ORDER BY gmv DESC; 4) 위의 결과 + itemid 의 제품이 무엇인지 ..