본문 바로가기
빅데이터전문가양성과정

데이터 분석 (6일차)

by HoneyIT 2020. 10. 22.

지난 5일차의 데이터 분석에 이어서 구글 계정에 권한을 허용한다.

jaeheonit.tistory.com/36

 

데이터 분석 (5일차)

실습할 데이터를 가져온다. https://data.kma.go.kr/ 기상자료개방포털 data.kma.go.kr 해당 사이트에 접속하여 기후통계분석 >> 통계분석 >> 기온분석 메뉴로 들어가서 기간설정 후 csv파일로 가져온다. 구

jaeheonit.tistory.com

 

엑셀 파일 불러오기

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
tempData = pd.read_excel('/gdrive/My Drive/BigData/data/AndongTemperature.xlsx')
tempData

엑셀 파일이 있는 구글 드라이브 경로를 지정해준다.

pd.read_csv가 아닌 pd.read_excel로 불러온다.

 

 

boxplot 그리기

highTemp = np.array(tempData['최고기온(℃)'])
np.sort(highTemp)
plt.boxplot(highTemp)

최고기온의 열을 추출하여 정렬한 후 boxplot으로 그린다.

 

 

jan = []
aug = []
for i in range(len(tempData)):
    month = str(tempData.iloc[i][0]).split('-')[1]
    if month == '01' :
        jan.append(tempData.iloc[i][-1])
    elif month == '08' :
        aug.append(tempData.iloc[i][-1])
plt.xticks([1], ['high'])
plt.boxplot(jan)
plt.boxplot(aug)

plt.show()

tempData의 열 수 만큼 for문을 돌린다.

첫 번째 열인 날짜를 iloc를 이용해 추출한 후 split으로 '-'을 기준으로 나누고 나누어진 1인덱스에 위치한 '달'을 month에 넣는다.

1월과 8월의 최고 기온을 각각 jan과 aug에 넣는다.

 

 

 

'빅데이터전문가양성과정' 카테고리의 다른 글

공공 데이터 활용  (0) 2020.11.09
데이터 분석 (7일차)  (1) 2020.10.26
데이터 선택 & 슬라이싱 (6일차)  (0) 2020.10.22
데이터 분석 (5일차)  (0) 2020.10.19
파이썬 기초 (1일차)  (0) 2020.10.05