지난 5일차의 데이터 분석에 이어서 구글 계정에 권한을 허용한다.
엑셀 파일 불러오기
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
tempData = pd.read_excel('/gdrive/My Drive/BigData/data/AndongTemperature.xlsx')
tempData
엑셀 파일이 있는 구글 드라이브 경로를 지정해준다.
pd.read_csv가 아닌 pd.read_excel로 불러온다.
boxplot 그리기
highTemp = np.array(tempData['최고기온(℃)'])
np.sort(highTemp)
plt.boxplot(highTemp)
최고기온의 열을 추출하여 정렬한 후 boxplot으로 그린다.
jan = []
aug = []
for i in range(len(tempData)):
month = str(tempData.iloc[i][0]).split('-')[1]
if month == '01' :
jan.append(tempData.iloc[i][-1])
elif month == '08' :
aug.append(tempData.iloc[i][-1])
plt.xticks([1], ['high'])
plt.boxplot(jan)
plt.boxplot(aug)
plt.show()
tempData의 열 수 만큼 for문을 돌린다.
첫 번째 열인 날짜를 iloc를 이용해 추출한 후 split으로 '-'을 기준으로 나누고 나누어진 1인덱스에 위치한 '달'을 month에 넣는다.
1월과 8월의 최고 기온을 각각 jan과 aug에 넣는다.
'빅데이터전문가양성과정' 카테고리의 다른 글
공공 데이터 활용 (0) | 2020.11.09 |
---|---|
데이터 분석 (7일차) (1) | 2020.10.26 |
데이터 선택 & 슬라이싱 (6일차) (0) | 2020.10.22 |
데이터 분석 (5일차) (0) | 2020.10.19 |
파이썬 기초 (1일차) (0) | 2020.10.05 |