일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 파이썬수업
- matplotlib
- 판다스데이터분석
- 주피터노트북판다스
- 판다스그래프
- 수업기록
- 주피터노트북데이터분석
- sql연습하기
- 주피터노트북
- python데이터분석
- Python
- 파이썬
- 파이썬시각화
- 데이터분석시각화
- 파이썬알고리즘
- SQL수업
- 파이썬차트
- 주피터노트북맷플롯립
- SQL
- 주피터노트북그래프
- 팀플기록
- python알고리즘
- 파이썬크롤링
- 파이썬데이터분석주피터노트북
- 파이썬데이터분석
- sql따라하기
- SQLSCOTT
- python수업
- 맷플롯립
- sql연습
- Today
- Total
목록수업기록 (187)
IT_developers

빅데이터 분석을 위한 파이썬 라이브러리 Numpy : 과학계산 및 수학계산 pandas : 데이터 처리 및 분석 matplotlib, seaborn : 데이터 시각화 plotly : 오픈 소스인 대화형의 고품질 도면 및 인터렉티브한 그래픽 라이브러리 SciPy : 신초 처리, 최적화, 과학 계산 및 통계 처리 BeautifulSoup : HTML과 XML 에서 정보를 수집 Scrapy : 웹 크롤링 및 데이터 수집 TensorFlow : 머신러닝 및 딥러닝 Keras : 신경망 라이브러리 및 딥러닝 NLTK : 자연어 처리 Numpy (Numerical Python) 파이썬의 수치 해석 프로그램인 Numeric 를 개선, 보완한 패키지 산술 계산을 위한 가장 중요한 필수 패키지 효율적인 다차원 배열인 n..

주피터 노트북 셀 단위로 파이썬 코드를 실행할 수 있는 도구 많이 사용 되는 도구 주피터 노트북을 온라인에서 사용 ==> 구글 Colab New - Python 3 클릭 새 파일 생성 Code : 코드를 입력할 수 있는 상태 Markdown : 주석으로 입력할 수 있는 상태 셀이 선택된 상태면 파란색 코드 입력 할 수 있는 상태면 초록색 단축키 Shift + Enter : 셀이 수행되고 새로운 셀 삽입 Ctrl + Enter : 셀 수행 A : 현재 셀 위에 셀 추가 B : 현재 셀 아래에 셀 추가 DD : 현재 셀 삭제 ESC + M : 코드에서 마크다운으로 변경됨 ESC : 초록색 화면에서 누르면 Tab : 자동완성 Shift + Tab : 설명을 볼수 있음 ex) np.zeros(( 커서 두고 ))..

아나콘다 통합 개발 환경 데이터 사이언스 - 빅데이터 분석 https://www.anaconda.com/==> 다운로드 Anaconda | The World's Most Popular Data Science Platform Anaconda is the birthplace of Python data science. We are a movement of data scientists, data-driven enterprises, and open source communities. www.anaconda.com 파이썬 데이터 분석을 하기 위해 주피터 노트북을 사용 할 예정 꼭, 아나콘다를 통해 들어올 필요 없음. ● 주피터 노트북 드라이브 경로 변경하기 기본 : C 드라이브 파일 위치 열기 - 설치된 폴더로 연..

1. TOP3 카테고리와 그 외 상품의 매출액 비교 SELECT item_type, SUM(gmv) AS gmv FROM ( SELECT CASE WHEN c.cate1 IN ( '스커트', '티셔츠', '원피스' ) THEN 'TOP3' ELSE '기타' END AS item_type, SUM(gmv) AS gmv FROM ordertbl o JOIN item i ON o.itemid = i.num JOIN category c ON i.category_id = c.num GROUP BY c.cate1, c.cate2, c.cate3 ORDER BY gmv DESC ) GROUP BY item_type; 2. 아이템 컨셉을 지정 후 추출 시크, 깜찍, 청순, 기본 키워드별 상품 분류 후 매출 조회 ord..

1. 남성이 구매하는 아이템 조회 남성인지 알수 있는 테이블 USERTBL - GENDER ORDERTBL - USERID 조인 1) 남성은 몇 명? SELECT COUNT(*) FROM usertbl WHERE gender = 'M'; 2) 남성이 구매한 아이템 아이디? 조회 (usertbl, ordertbl 테이블 조인) SELECT u.userid, o.itemid FROM usertbl u JOIN ordertbl o ON u.userid = o.userid WHERE u.gender = 'M'; 3) 7,20 아이템명과 매출액 조회 SELECT i.item_name, SUM(gmv) AS gmv FROM usertbl u JOIN ordertbl o ON u.userid = o.userid JO..

ORDERTBL 데이터 분석 orderTBL orderid 컬럼은 item id(num)와 일치 orderTBL userid 컬럼은 usertbl 의 userid와 일치 item category_id 컬럼은 category id(num) 와 일치 1. orderTBL 조회 SELECT * FROM ordertbl; 1) userid가 없는 주문 내역 조회 SELECT * FROM ordertbl WHERE userid IS NULL; 2) 아이템 테이블 조회 3) 상품별 매출액 집계 후 매출액 높은 순으로 정렬 SELECT itemid, SUM(gmv) AS gmv FROM ordertbl GROUP BY itemid ORDER BY gmv DESC; 4) 위의 결과 + itemid 의 제품이 무엇인지 ..

1. 연도별 매출액 조회 1) 2017년도의 '여행 및 교통서비스' 카테고리 조회 SELECT * FROM gmv_trend WHERE yyyy = 2017 AND category = '여행 및 교통서비스'; 2) 2017년도의 '컴퓨터 및 주변기기' 카테고리 조회 SELECT * FROM gmv_trend WHERE yyyy = 2017 AND category = '컴퓨터 및 주변기기'; 3) 연도가 2018이거나 category 명이 '컴퓨터 및 주변기기' 매출액 SELECT * FROM gmv_trend WHERE yyyy = 2018 OR category = '컴퓨터 및 주변기기'; 4) 연도가 2018년이고, gmv가 100,000보다 작고, gmv가 10,000보다 큰 매출(단위: 백만원) S..

gmv_trend : 2017년 ~ 2021년 3월까지 전자 상거래 추정 거래액 (단위 : 백만원) 1. 데이터 탐색 - 모든 컬럼 추출하기 1) gmv_trend테이블 확인 SELECT * FROM gmv_trend; 2) 카테고리, 거래 총액 조회 SELECT category, gmv FROM gmv_trend; 3) category 중복값 없이 조회 SELECT DISTINCT category FROM gmv_trend; 4) yyyy 중복값 없이 조회 SELECT DISTINCT yyyy FROM gmv_trend; 2. 특정 연도의 매출액 탐색 연도 컬럼이 숫자 타입 => 대소비교, between 1) 2017년 연도의 매출액 SELECT * FROM gmv_trend WHERE yyyy = 2..