본문 바로가기
빅데이터전문가양성과정

머신러닝을 이용한 암 데이터 다루기

by HoneyIT 2020. 11. 23.

데이터 받아오기

breast_cancer = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data', header = None)

위 링크로 접속하면 해당 홈페이지에서 직접 데이터를 수집할 수 있습니다.

 

 

breast_cancer.columns = ['id_number', 'Clump_Thickness', 'Unif_Cell_Size', 'Unif_Cell_Shape','Marg_Adhesion', 
                         'Single_Epith_Cell_Size', 'Bare_Nuclei','Bland_Chromatin', 'Normal_Nucleoli', 'Mitoses', 'Class']

 

breast_cancer.head()

 

 

breast_cancer.info()

info : 데이터의 정보를 나타냅니다. (행과 열의 크기, 컬럼명, 컬럼을 구성하는 값의 자료형 등)