군집화 KMean 알고리즘 2

Deep Learning

군집화 KMean 알고리즘 2

HoneyIT 2020. 8. 12. 13:08

csv = pd.read_csv("iris.csv")
data = csv[["sepal.length","sepal.width","petal.length","petal.width"]]
label = csv["variety"]

iris.csv 파일을 가져와서 각각의 컬럼을 data와 label에 넣는다

kmeans = KMeans(n_clusters=3)

군집의 갯수를 개로 부여한다.

kmeans.fit(data)
result = kmeans.labels_

여러 data의 값들을 군집시키고 각 data 행의 label을 result에 저장한다.

다음과 같은 결과가 나오는데 왼쪽 값이 종류 오른쪽 값이 군집이다.

즉, 0이라는 종류는 대부분 0이라는 군집에 속한다.

다만 위의 빨간 표시와 같이 1이라는 종류가 1이라는 군집에 속하지 않고 2에 속하는 오차가 발생할 수도 있다.

import pandas as pd
from sklearn.cluster import KMeans
from sklearn import svm

csv = pd.read_csv("iris.csv")
data = csv[["sepal.length","sepal.width","petal.length","petal.width"]]
label = csv["variety"]
kmeans = KMeans(n_clusters=3)
kmeans.fit(data)
result = kmeans.labels_

for i in range(0, len(label)):
    print(label[i], " ", end="")
    print(result[i], end="")
    if (i+1)%10==0:
        print(", ")
    else:
        print(", ", end="")