일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 팀플기록
- matplotlib
- SQLSCOTT
- 주피터노트북데이터분석
- 파이썬수업
- 주피터노트북맷플롯립
- 판다스데이터분석
- 파이썬데이터분석주피터노트북
- python수업
- 주피터노트북
- Python
- SQL수업
- SQL
- sql따라하기
- 주피터노트북판다스
- 파이썬크롤링
- 파이썬알고리즘
- 맷플롯립
- 파이썬데이터분석
- 데이터분석시각화
- 수업기록
- 판다스그래프
- 파이썬차트
- python데이터분석
- 파이썬시각화
- 주피터노트북그래프
- sql연습하기
- python알고리즘
- sql연습
- 파이썬
- Today
- Total
IT_developers
SQL Developer - 데이터 분석(4) 본문

1. 남성이 구매하는 아이템 조회
- 남성인지 알수 있는 테이블 USERTBL - GENDER
- ORDERTBL - USERID 조인

1) 남성은 몇 명?
SELECT
COUNT(*)
FROM
usertbl
WHERE
gender = 'M';

2) 남성이 구매한 아이템 아이디? 조회 (usertbl, ordertbl 테이블 조인)
SELECT
u.userid,
o.itemid
FROM
usertbl u
JOIN ordertbl o ON u.userid = o.userid
WHERE
u.gender = 'M';

3) 7,20 아이템명과 매출액 조회
SELECT
i.item_name,
SUM(gmv) AS gmv
FROM
usertbl u
JOIN ordertbl o ON u.userid = o.userid
JOIN item i ON o.itemid = i.num
WHERE
u.gender = 'M'
GROUP BY
i.item_name;

2. 내부조인과 외부조인
SELECT
*
FROM
ordertbl
WHERE
userid IS NULL; --24명

SELECT
*
FROM
usertbl
WHERE
userid IS NULL; --0명

1) 내부조인
- ordertbl과 usertbl 조인할 때
- gender, age_band, sum(gmv)
- group by gender, age_band
- 24명에 대한 정보는 빠지고 조회됨.
SELECT
u.gender,
u.age_band,
SUM(gmv) AS gmv
FROM
ordertbl o
JOIN usertbl u ON o.userid = u.userid
GROUP BY
u.gender,
u.age_band
ORDER BY
u.gender,
u.age_band;

2) 외부조인
- 9행이 출력 : 비회원 구매 매출액
SELECT
u.gender,
u.age_band,
SUM(gmv) AS gmv
FROM
ordertbl o
LEFT OUTER JOIN usertbl u ON o.userid = u.userid
GROUP BY
u.gender,
u.age_band
ORDER BY
u.gender,
u.age_band;

3. 날짜 조회
1) ordertbl 날짜 컬럼 조회
SELECT
dt
FROM
ordertbl;

2) number ==> 문자열로 변경
SELECT
dt,
to_char(dt) AS yyyymmdd
FROM
ordertbl;

3) 년, 월, 일 구별 : 문자로 변경했기 때문에 잘라내기 가능
SELECT
dt,
substr(to_char(dt), 1, 4) AS yyyy,
substr(to_char(dt), 5, 2) AS mm,
substr(to_char(dt), 7, 2) AS dd
FROM
ordertbl;
-- 한꺼번에 연결
SELECT
dt,
substr(to_char(dt), 1, 4)
|| '-'
|| substr(to_char(dt), 5, 2)
|| '-'
|| substr(to_char(dt), 7, 2) AS yyyymmdd
FROM
ordertbl;

4. null 인 경우 다른 값으로 변경
1) ordertbl userid가 null 인 경우 0으로 변경
SELECT
userid,
nvl(userid, '0')
FROM
ordertbl
WHERE
userid IS NULL;

2) userid가 null이면 'NA'변경
-- NA : 오류
number 타입인데 문자열로 바꿀 수 없음
SELECT
userid,
nvl(userid, 'NA') -- 01722. 00000 - "invalid number"
FROM
ordertbl
WHERE
userid IS NULL;

-- 수정 후
SELECT
userid,
nvl(to_char(userid), 'NA')
FROM
ordertbl
WHERE
userid IS NULL;

3) 결과 값이 null 인경우 'NA'로 출력
SELECT
nvl(u.gender, 'NA') AS gender,
nvl(u.age_band, 'NA') AS age_band,
SUM(gmv) AS gmv
FROM
ordertbl o
LEFT OUTER JOIN usertbl u ON o.userid = u.userid
GROUP BY
u.gender,
u.age_band
ORDER BY
u.gender,
u.age_band;

5. case ~ when ~ else
1) F : 여성, M: 남성으로 출력되게 하고 싶음
SELECT
gender,
CASE gender
WHEN 'M' THEN
'남성'
WHEN 'F' THEN
'여성'
ELSE
'NA'
END AS 성별
FROM
usertbl;

2) 20~24 : 20s, 25~29 : 20s, 30~34,35~39 : 30s, 40~44: 40s, else : NA
SELECT
nvl(u.gender, 'NA') AS gender,
CASE u.age_band
WHEN '20~24' THEN
'20s'
WHEN '25~29' THEN
'20s'
WHEN '30~34' THEN
'30s'
WHEN '35~39' THEN
'30s'
WHEN '40~44' THEN
'40s'
ELSE
'NA'
END AS age_gorup,
SUM(gmv) AS gmv
FROM
ordertbl o
LEFT OUTER JOIN usertbl u ON o.userid = u.userid
GROUP BY
u.gender,
u.age_band
ORDER BY
u.gender,
u.age_band;

'SQL' 카테고리의 다른 글
SQL Developer - 데이터 분석(5) (1) | 2022.10.15 |
---|---|
SQL Developer - 데이터 분석(3) (0) | 2022.10.13 |
SQL Developer - 데이터 분석(2) (0) | 2022.10.12 |
SQL Developer - 데이터 분석(1) (0) | 2022.10.11 |
SQL Developer - 데이터 분석 환경 설정 (0) | 2022.10.10 |