본문 바로가기
빅데이터전문가양성과정

데이터 선택 & 슬라이싱 (6일차)

by HoneyIT 2020. 10. 22.

iloc와 loc로 데이터 선택하기

loc : '칼럼명'을 기준으로 데이터프레임의 데이터를 선택

iloc : '인덱스 번호'로 선택

 

import numpy as np
import pandas as pd

df2d = pd.DataFrame(np.random.randn(8, 8), columns=['서울', '경기', '광주', '대구', '부산', '전주', '대전', '세종'])
df2d = np.abs(df2d)
df2d

rand : 0에서 1사이의 균일한 확률 분포로 실수 난수 생성

randn : 기댓값이 0이고 표준편차가 1인 가우시안 표준 정규 분포를 따르는 난수 생성

 

df2d.loc[:, '인천'] = np.abs(np.random.rand(8))

loc를 통해 '인천'이라는 칼럼을 생성,접근하여 모든 열에 난수를 생성합니다.

 

 

다음과 같이 잘 생성된것을 확인할 수 있습니다.

 

 

sudo = df2d.iloc[:, [0,1,8]]

iloc를 이용하여 모든 행의 0, 1, 8열에 접근한 값을 sudo에 넣습니다.

 

 

다다음과 같이 잘 추출한 것을 볼 수 있습니다.

 

 

'빅데이터전문가양성과정' 카테고리의 다른 글

데이터 분석 (7일차)  (1) 2020.10.26
데이터 분석 (6일차)  (0) 2020.10.22
데이터 분석 (5일차)  (0) 2020.10.19
파이썬 기초 (1일차)  (0) 2020.10.05
Colaboratory 환경설정(1일차)  (2) 2020.10.05