-
머신러닝 - 지도학습, 비지도학습, 강화학습머신러닝 & 딥러닝/머신러닝 기초 2024. 1. 22. 13:13
머신러닝이란??
머신러닝이란 사람이 모든 조건을 코딩해서 기계에게 알려주는 것 대신에 기계가 데이터로부터 학습하여 실행할 수 있도록 하는 알고리즘을 연구하는 분야이다. 즉, 컴퓨터 시스템이 데이터를 학습할 수 있는 능력을 부여하는 것이라고 말할 수 있다.
머신러닝의 종류에는 지도학습, 비지도학습, 강화학습, 준지도학습이 있다. 그 중 지도학습, 비지도학습, 강화학습의 개념에 대해서 간단히 알아보자.
지도학습이란?
지도학습은 Classification, Regression으로 나뉜다. Classification은 다양한 파라미터를 기반으로 데이터셋들을 클래스로 분할하는데 도움이 되는 함수를 찾는 것이다. Regression은 변수 집합 X가 주어지면 Y를 예측하는 것이다. 여기서 Y는 Numeric이다. 매출 예측, 주식시장 예측 등이 Regression의 예다. 일반적인 지도학습 알고리즘으로는 KNN, SVM, Decision tree, Random forest, Linear regression, Logistic regression, Neural network, Deep learning 등이 있다.
지도학습을 다음과 같이 표현할 수 있다.
- Labeled Data
- Direct Feedback
- Predict outcome / future
비지도학습이란??
비지도학습은 데이터셋에서 패턴을 찾는 것이다. 정답 지표가 없는 데이터셋으로부터 정보를 추출하는 것이라고 말할 수 있다. 비지도학습은 Clustering, Dimension reduction 두개의 카테고리로 나뉜다.
Clustering은 비슷한 아이템들의 그룹을 찾는 것으로 데이터 간 거리를 계산하여 입력을 몇개의 그룹으로 나누는 방법이다.
Dimension reduction은 시각화, feature 추출, 선택을 위해 고차원의 데이터를 저차원의 데이터로 만드는 것이다. 여기서 feature란 property or characteristic of sample이다.
비지도학습은 다음과 같이 표현할 수 있다.
- No Labels
- No Feedback
- Find Hidden Structure
강화학습이란??
강화학습이란 Agent가 현재 상태를 인지하여 선택 가능한 행동들 중에서 보상을 최대화하는 행동 또는 행동 순서를 선택하는 것이다.
강화학습은 Not supervised learning, Not unsupervised learning의 특징을 갖는다.
매 상태에 대해 취해야 할 정답을 알지 못하기 때문에 Not supervised learning의 특징을 갖는다. 반면에 환경으로부터 reward 형태로 피드백을 받기 때문에 Not unsupervised learning의 특징을 갖는다.
강화학습은 다음과 같이 표현할 수 있다.
- Decision Process
- Reward System
- Learn series of actions
정리
머신러닝이랑 기계에게 데이터를 준 다음 기계가 직접 학습하여 결과를 도출해내게 하는 것이었다.
머신러닝에는 크게 지도학습, 비지도학습, 강화학습으로 나뉠 수 있다.
지도학습은 Classification, Regression으로 나눌 수 있고 비지도학습은 크게 Clustering, Dimension reduction 두개의 카테고리로 나눌 수 있다. 강화학습은 보상을 최대로 하는 행동 또는 행동 순서를 결정하는 Reward System이라고 할 수 있다.
지도학습은 다음과 같이 설명할 수 있다.
- Classification
- Regression
- Evalution and model selection
비지도학습은 다음과 같이 설명할 수 있다.
- Clustering
- Dimension reduction / Visualization
- Recommender system
참고자료
'머신러닝 & 딥러닝 > 머신러닝 기초' 카테고리의 다른 글
머신러닝 - Logistic Regression (0) 2024.03.04 머신러닝 - Linear Regression (2) 2024.02.08 머신러닝 - Performance Metrics (평가지표) (2) 2024.01.24 머신러닝 - Bias and Variance trade-off (0) 2024.01.09