Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 팀플기록
- 주피터노트북
- 파이썬알고리즘
- 파이썬시각화
- 파이썬
- SQL
- sql따라하기
- 데이터분석시각화
- 판다스그래프
- 파이썬데이터분석
- python데이터분석
- 파이썬수업
- 주피터노트북맷플롯립
- python수업
- 주피터노트북판다스
- 주피터노트북그래프
- SQLSCOTT
- 파이썬데이터분석주피터노트북
- 주피터노트북데이터분석
- 파이썬크롤링
- matplotlib
- 맷플롯립
- 수업기록
- 판다스데이터분석
- python알고리즘
- sql연습
- SQL수업
- sql연습하기
- Python
- 파이썬차트
Archives
- Today
- Total
IT_developers
Python 데이터 분석(주피터노트북) - 국제 축구 경기 본문
국제 축구 경기 데이터
- 1872년 ~ 2019년까지 전세계에서 개최된 국제 축구 대회데이터
라이브러리 및 세팅
- import seaborn as sns
- seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함
- sns.set(font_scale=1)
- import pandas as pd
- import matplotlib.pyplot as plt
- 한글처리
- plt.rcParams['font.family'] = 'Malgun Gothic'
- plt.rcParams['axes.unicode_minus'] = False
- 경고 메세지
- import warnings
- warnings.simplefilter("ignore")
- seaborn 스타일의 그래프를 사용
- plt.style.use('seaborn')
- from wordcloud import WordCloud, ImageColorGenerator
데이터 로드

데이터 탐색
- neutral : 중립국에서 개최된 경기



데이터 전처리
1) 날짜 데이터 타입 변경(object ==> datetime)

2) 날짜 데이터 순으로 내림차순 정렬

3) 홈경기과 원정 경기의 득접 합과 득점 차 결과를 새로운 컬럼으로 생성
- score_sum = home_score + away_score
- score_diff = home_score + away_score
- 절대값 abs

데이터분석
1) 숫자 컬럼들 간의 상관관계
- corr

1-1) 상관관계 시각화
- heatmap

2) 홈경기와 원정 경기 중 최대골과 최소골 표시
- formal_score = max(home_score, away_score) - min(home_score, away_score)

3) 원정팀이 방문했던 경기에서 홈팀이 획득한 점수
- 원정팀으로 그룹

- 그중에서도 홈팀만 조회

- 30개의 경기만 조회후 시각화
- x축 away 팀명, y축 home_score
- 수치 기입 for문
- bar_label : 버전에 따라 달라질수 있음

4) 토너먼트에 관련된 워드 클라우드
- 토너먼트 값 조회

- 값을 이용해 텍스트형식으로 만들기

- 워드 클라우드 생성
- generate : 넣어줄 내용
- axis ('off'): 좌표 내용 표시 않기
- interpolation='bilinear' : 기본값

- 도시이름 조회 후 워드 클라우드

5) 국제 대회 종류/ 종류별 개최 횟수
- 종류별 개최 횟수


1) 상위 10개 대회 종류와 개체 횟수 시각화
- 상위 10개 조회

- barchart 그리기

6) 홈팀 득점에 대한 원정팀 득점 시각화
- scatterplot

- 그 중에서 중립국에서 개최 했는지

7) 홈팀 기준 대회 참가 횟수가 많은 10개국
- 홈팀 기준으로 조회

- barplot 그리기

8) 대한민국 축구 국가 대표팀 경기 결과
- home_team 이 우리나라인 데이터 추출 후 새로운 데이터 프레임 생성(korea)

- 우리나라와 시합했던 국가명 추출 및 수 확인

- 대한민국과 경기했던 국가들의 득점 합과 실점 합 리스트로 작성
- away_team list ==> away_score
- korea_team list ==> home_score

- 대한민국과 경기했던 국가명, 실점, 득점 리스트를 하나의 데이터 프레임 생성 => all_country

- 원정 팀 과 한국팀 점수 비교 시각화

- 한국 축구 점수 이름 순 20개만 시각화

9) 2009 ~ 2019년까지 홈팀 대한민국 축구 국가대표팀과 원정팀 사이 경기에서 평균 득점
- average_df 생성
- 2019년도의 score_sum를 모아서 평균을 내면 됨.

- barplot 그리기

10) 5년간(2015~2019)의 대한민국의 국제 경기 결과확인
- formal_score 이용
- 5년간 데이터 추출
- 정규분포 사용



- barplot 그리기

'Python' 카테고리의 다른 글
Python 차트 시각화(주피터 노트북) - plotly (0) | 2022.12.08 |
---|---|
Python 데이터 분석(주피터노트북) - Lakers(농구) (0) | 2022.12.07 |
Python 문자 시각화(주피터노트북) - 워드 클라우드 (0) | 2022.12.06 |
Python 데이터 분석(주피터노트북) - 타이타닉 (0) | 2022.12.05 |
Python 데이터 분석(주피터노트북) - 서울시 따릉이 (0) | 2022.12.04 |