인공지능 : 사람이 판단하는 것처럼 컴퓨터(기계)가 판단하게 하는 기술
- 의사결정 알고리즘(일상에서 발생하는 현상을 알고리즘에 적용)
1. 뉴럴 네트워크
2. 개미
3. 떼 지능
4. 세포조직 등..
(정답을 구할 수 없으면 근사값을 구한다.)
머신러닝 : 인간의 뇌에 있는 신경망(NN)처럼 인공신경망(ANN)을 이용해서 학습하는 기술
학사 석사 과정에서는 반복 -> 재귀 -> 분할, 정복의 과정을 주로 다룬다
이후의 과정은 의사결정이고 이 과정은 박사 이상에서 다룬다.
작업의 종류
분류 ex) 강아지인지 고양이인지 | 회귀 ex) 거리에 따른 택시 가격 예측 | 예측 |
군집(Clustering) | 이상값 감지 | |
강화학습 |
분류와 군집은 거의 유사 = 클러스터링(Clustering)이라고도 부름
분류 : 학습된 정보를 바탕으로 값을 주고 맞추도록 하는 것
군집 : 비슷한 것끼리 묶는 것
머신러닝 내에서 분류 = 클러스터링
지도학습 : 학습할 때 독립변수와 종속변수를 함께 전달, 종속변수(label)을 제공하여 학습 (분류, 회귀)
비지도학습 : 종속변수(label)을 제공하지 않고 학습 (군집, 이상점, 강화)
언더핏 : 원하는 값을 찾지 못하고 멈춤
굿핏 : 원하는 값을 찾고 학습을 멈춤
오버핏 : 원하는 값을 찾고 학습을 계속함
임계치 : 나머지에 대한 값의 평균치
label(종속변수) = W(가중치) x feature(독립변수) + b(임계치)
model = Regussion() : 모델 생성
model.fit(f, l) : 학습, l은 label
result = model.predict(7) : 예측
1. 모델 생성
분류 모델 : slf = svm.SVC()
회귀 모델 : reg = LinearRegression
2. 학습
slf.fit(data, label)
3. 예측 및 평가
result = slf.predict(example)
+ 시각화
이러한 모든 작업들을 사이킷 런
군집 vs 분류
분류
-
군집 (KMean)
- 독립변수만을 넣어 label을 출력값으로 가진다.
- 하나의 군집 내에 데이터들의 거리가 가깝고 군집사이의 거리가 멀 수록 군집화가 잘 되었다고 볼 수 있다.
svm(support vector machin)을 이용한 지도 학습 모델
import pandas as pd
from sklearn import svm
csv = pd.read_csv("iris.csv")
data = csv[["sepal.length","sepal.width","petal.length","petal.width"]]
label = csv["variety"]
example = [[6.3,2.5,4.9,1.5]]
clf = svm.SVC()
clf.fit(data, label)
result = clf.predict(example)
print(result)
'Deep Learning' 카테고리의 다른 글
분류 모델 2 (0) | 2020.08.12 |
---|---|
군집화 KMean 알고리즘 2 (0) | 2020.08.12 |
군집화 KMean 알고리즘 (1) | 2020.08.12 |
분류 모델 (0) | 2020.08.11 |
선형회귀 모델 (0) | 2020.08.11 |