IT_developers

Python 데이터 분석(주피터노트북) - 국제 축구 경기 본문

Python

Python 데이터 분석(주피터노트북) - 국제 축구 경기

developers developing 2022. 12. 6. 13:00

국제 축구 경기 데이터

  • 1872년 ~ 2019년까지 전세계에서 개최된 국제 축구 대회데이터

라이브러리 및 세팅

  • import seaborn as sns
  • seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함
    • sns.set(font_scale=1)
  • import pandas as pd
  • import matplotlib.pyplot as plt
  • 한글처리
    • plt.rcParams['font.family'] = 'Malgun Gothic'
    • plt.rcParams['axes.unicode_minus'] = False
  • 경고 메세지
    • import warnings
    • warnings.simplefilter("ignore")
  • seaborn 스타일의 그래프를 사용
    • plt.style.use('seaborn')
  • from wordcloud import WordCloud, ImageColorGenerator

 

데이터 로드

 

데이터 탐색

  • neutral : 중립국에서 개최된 경기

 

데이터 전처리

1) 날짜 데이터 타입 변경(object ==> datetime)

2) 날짜 데이터 순으로 내림차순 정렬

3) 홈경기과 원정 경기의 득접 합과 득점 차 결과를 새로운 컬럼으로 생성

  • score_sum = home_score + away_score
  • score_diff = home_score + away_score
  • 절대값 abs

 

데이터분석

1) 숫자 컬럼들 간의 상관관계

  • corr

1-1) 상관관계 시각화

  • heatmap

 

2) 홈경기와 원정 경기 중 최대골과 최소골 표시

  • formal_score = max(home_score, away_score) - min(home_score, away_score)

 

3) 원정팀이 방문했던 경기에서 홈팀이 획득한 점수

  • 원정팀으로 그룹

  • 그중에서도 홈팀만 조회

 

  • 30개의 경기만 조회후 시각화
  • x축 away 팀명,  y축 home_score
  • 수치 기입 for문
  • bar_label : 버전에 따라 달라질수 있음

4) 토너먼트에 관련된 워드 클라우드

  • 토너먼트 값 조회

  • 값을 이용해 텍스트형식으로 만들기

 

  • 워드 클라우드 생성
    • generate : 넣어줄 내용
    • axis ('off'): 좌표 내용 표시 않기
    • interpolation='bilinear' : 기본값

  • 도시이름 조회 후 워드 클라우드

 

5) 국제 대회 종류/ 종류별 개최 횟수

  • 종류별 개최 횟수

 

1) 상위 10개 대회 종류와 개체 횟수 시각화

  • 상위 10개 조회

  • barchart 그리기

 

6) 홈팀 득점에 대한 원정팀 득점 시각화

  • scatterplot

  • 그 중에서  중립국에서 개최 했는지

 

7) 홈팀 기준 대회 참가 횟수가 많은 10개국

  • 홈팀 기준으로 조회

 

  • barplot 그리기

 

 

8) 대한민국 축구 국가 대표팀 경기 결과

  • home_team 이 우리나라인 데이터 추출 후 새로운 데이터 프레임 생성(korea)

  • 우리나라와 시합했던 국가명 추출 및 수 확인

  • 대한민국과 경기했던 국가들의 득점 합과 실점 합 리스트로 작성
    • away_team list ==> away_score
    • korea_team list ==> home_score

  • 대한민국과 경기했던 국가명, 실점, 득점 리스트를 하나의 데이터 프레임 생성 => all_country

 

  • 원정 팀 과 한국팀 점수 비교 시각화

  • 한국 축구 점수 이름 순 20개만 시각화

 

9) 2009 ~ 2019년까지 홈팀 대한민국 축구 국가대표팀과 원정팀 사이 경기에서 평균 득점

  • average_df 생성
  • 2019년도의 score_sum를 모아서 평균을 내면 됨.

  • barplot 그리기

 

10) 5년간(2015~2019)의 대한민국의 국제 경기 결과확인

  • formal_score 이용
  • 5년간 데이터 추출
  • 정규분포 사용

  • barplot 그리기

Comments