데이터 선택 & 슬라이싱 (6일차)

iloc와 loc로 데이터 선택하기

loc : '칼럼명'을 기준으로 데이터프레임의 데이터를 선택

iloc : '인덱스 번호'로 선택

import numpy as np
import pandas as pd

df2d = pd.DataFrame(np.random.randn(8, 8), columns=['서울', '경기', '광주', '대구', '부산', '전주', '대전', '세종'])
df2d = np.abs(df2d)
df2d

rand : 0에서 1사이의 균일한 확률 분포로 실수 난수 생성

randn : 기댓값이 0이고 표준편차가 1인 가우시안 표준 정규 분포를 따르는 난수 생성

df2d.loc[:, '인천'] = np.abs(np.random.rand(8))

loc를 통해 '인천'이라는 칼럼을 생성,접근하여 모든 열에 난수를 생성합니다.

다음과 같이 잘 생성된것을 확인할 수 있습니다.

sudo = df2d.iloc[:, [0,1,8]]

iloc를 이용하여 모든 행의 0, 1, 8열에 접근한 값을 sudo에 넣습니다.

다다음과 같이 잘 추출한 것을 볼 수 있습니다.

'빅데이터전문가양성과정' 카테고리의 다른 글

데이터 분석 (7일차) (1)	2020.10.26
데이터 분석 (6일차) (0)	2020.10.22
데이터 분석 (5일차) (0)	2020.10.19
파이썬 기초 (1일차) (0)	2020.10.05
Colaboratory 환경설정(1일차) (2)	2020.10.05

달콤한 개발 일기

데이터 선택 & 슬라이싱 (6일차)

'빅데이터전문가양성과정' 카테고리의 다른 글

티스토리툴바

데이터 선택 & 슬라이싱 (6일차)

'빅데이터전문가양성과정' 카테고리의 다른 글

관련글

티스토리툴바