본문 바로가기

분류 전체보기84

데이터 분석 (7일차) df2d.loc[:, '평균'] = df2d.iloc[:, :8].mean(axis=1) 위의 데이터중 모든 열의 7행까지 가로방향의 평균을 구한다. df2d.sort_values(by=["평균"], ascending=True) 평균 값을 기준으로 ascending을 이용하여 오름차순으로 바꾼다. 순위 구하기 first : DataFrame에 같은 값이 존재하는 경우 저장되어 있는 순서대로 순위를 지정 (값 : 100, 85, 85, 70 ==> 순위 : 1, 2, 3, 4) 주의 : first 방법은 숫자 타입만 가능, numeric_only=True도 같이 설정해야 함 min : 중복 값이 있는 만큼 순위를 건너뛰고 표시 (값 : 100, 85, 85, 70 ==> 순위 : 1, 2, 2, 4) ma.. 2020. 10. 26.
데이터 분석 (6일차) 지난 5일차의 데이터 분석에 이어서 구글 계정에 권한을 허용한다. jaeheonit.tistory.com/36 데이터 분석 (5일차) 실습할 데이터를 가져온다. https://data.kma.go.kr/ 기상자료개방포털 data.kma.go.kr 해당 사이트에 접속하여 기후통계분석 >> 통계분석 >> 기온분석 메뉴로 들어가서 기간설정 후 csv파일로 가져온다. 구 jaeheonit.tistory.com 엑셀 파일 불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt tempData = pd.read_excel('/gdrive/My Drive/BigData/data/AndongTemperature.xlsx') tempData.. 2020. 10. 22.
데이터 선택 & 슬라이싱 (6일차) iloc와 loc로 데이터 선택하기 loc : '칼럼명'을 기준으로 데이터프레임의 데이터를 선택 iloc : '인덱스 번호'로 선택 import numpy as np import pandas as pd df2d = pd.DataFrame(np.random.randn(8, 8), columns=['서울', '경기', '광주', '대구', '부산', '전주', '대전', '세종']) df2d = np.abs(df2d) df2d rand : 0에서 1사이의 균일한 확률 분포로 실수 난수 생성 randn : 기댓값이 0이고 표준편차가 1인 가우시안 표준 정규 분포를 따르는 난수 생성 df2d.loc[:, '인천'] = np.abs(np.random.rand(8)) loc를 통해 '인천'이라는 칼럼을 생성,접근하.. 2020. 10. 22.
pandas 자료구조 (5일차) Series : numpy의 1차원 array와 유사 DataFrame : numpy의 2차원 array와 유사 Series obj = pd.Series([96, 88, 100, 68]) series는 색인(Index)과 값(Values)을 가진다. score = pd.Series([96, 88, 100, 68], index=['김은서', '박민철', '정윤주', '홍길동']) score 색인과 값을 따로 줄 수 있다. Dictionary와 Series Series : 파이썬의 사전과 유사, 고정 길이의 사전 Series 객체는 파이썬의 사전형을 인자로 받아야 하는 함수에서 사전형을 대체하여 사용할 수 있다. covid19 = {'세울': 5702, '대구': 7142, '경기':4869, '경북':15.. 2020. 10. 19.
데이터 분석 (5일차) 실습할 데이터를 가져온다. https://data.kma.go.kr/ 기상자료개방포털 data.kma.go.kr 해당 사이트에 접속하여 기후통계분석 >> 통계분석 >> 기온분석 메뉴로 들어가서 기간설정 후 csv파일로 가져온다. 구글 계정과 연동 from google.colab import drive drive.mount('/gdrive', force_remount=True) URL에 접속하여 계정을 선택하고 코드를 넣으면 구글 계정와 연동된다. CSV 파일 열기 import numpy as np import pandas as pd tempData = pd.read_csv('/gdrive/My Drive/BigData/data/안동기온분석.csv', encoding='utf-8') tempData /gd.. 2020. 10. 19.
파이썬 기초 (1일차) 변수 소개 - 변수는 프로그램 수행에 필요한 자료(값)을 저장하는 공간(메모리)이다. - 변수에 저장된 값은 언제든지 다른 값으로 바뀔 수 있다. - 할당문(대입문)을 사용하여 변수에 값을 저장한다. 변수 이름 짓기 - 의미 있는 이름으로 짓는다. - 소문자와 대문자를 구별한다. - 변수 이름은 영문자와 숫자, 밑줄(_)로 이루어진다. (첫 글자가 숫자가 될 수 없다.) - 변수의 이름에 공백이나 특수문자가 들어가면 안된다. 낙타식 표기법 (Camel Case) : myNewCar, userList, ... 파스칼식 표기법(Pascal Case) : MyNewCar, UserList, ... 케밥식 표기법(Kebab Case) : my-new-car, user-list, ... 수식(Expression).. 2020. 10. 5.