본문 바로가기
카테고리 없음

pandas 자료구조 (5일차)

by HoneyIT 2020. 10. 19.

Series : numpy의 1차원 array와 유사

DataFrame : numpy의 2차원 array와 유사

 

Series

obj = pd.Series([96, 88, 100, 68])

series는 색인(Index)과 값(Values)을 가진다.

 

score = pd.Series([96, 88, 100, 68], index=['김은서', '박민철', '정윤주', '홍길동'])
score

색인과 값을 따로 줄 수 있다.

 

Dictionary와 Series

Series : 파이썬의 사전과 유사, 고정 길이의 사전
Series 객체는 파이썬의 사전형을 인자로 받아야 하는 함수에서 사전형을 대체하여 사용할 수 있다.

 

covid19 = {'세울': 5702, '대구': 7142, '경기':4869, '경북':1573, '인천':999, '광주':502, '충남':505, '부산':571}
covid_19 = pd.Series(covid19) #dictionary 를 series로 변환
covid_19

dictionary로 생성된 covid19를 series형태의 covid_19로 pandas를 이용해 바꾼다.

 

 

DataFrame

엑셀의 표와 같은 형식의 자료구조

data = {'지역': ['서울', '대구', '경기', '경북', '인천', '광주', '충남', '부산'], '확진' : [4094, 7120, 4089, 1502, 865, 485, 463, 369]}
covid_19f = pd.DataFrame(data)
covid_19f

 

covid_19f.head()

head()함수로 첫 5행만 출력할 수 있다.