머신러닝 & 딥러닝/머신러닝 기초
-
머신러닝 - Logistic Regression머신러닝 & 딥러닝/머신러닝 기초 2024. 3. 4. 14:41
머신러닝에서 예측 모델 머신러닝은 지도학습, 비지도학습, 강화학습으로 나눌 수 있었다. 그 중 지도학습에는 Classification과 Regression이 있었다. Classification은 예측 모델링의 하나로 mapping function을 input X에서 discrete한 변수 Y로 근사화하는 것이다. 이 과정에서 learning parameter를 기준으로 데이터 셋을 다른 클래스로 나눌 함수를 찾는다. Regression은 예측 모델링의 하나로 mapping function을 input X에서 continuous한 변수 Y로 근사화하는 것이다. Continuous한 output은 부동 소수점, 정수와 같은 실수값을 포함하는 변수를 뜻한다. 여기서 mapping function이란 모델 학습..
-
머신러닝 - Linear Regression머신러닝 & 딥러닝/머신러닝 기초 2024. 2. 8. 12:22
Regression이란?? 머신러닝은 지도학습, 비지도학습, 강화학습으로 나눌 수 있었다. 그 중 지도학습은 Classification, Regression으로 나눌 수 있었다. 그렇다면 Regression이란 무엇일까?? Regression은 변수들의 집합 X가 주어지면 한 변수 Y를 예측하는 것이다. Regression에서 Y는 numeric이다. 즉, Regreesion은 선형 또는 비선형 모델을 가정하는 것으로 주식 시장 예측, 매출 예측 등을 예로 들 수 있겠다. 따라서 Regression은 일반적으로 numerical한 데이터들을 분석하고 모델링하는데 사용되는 기술이다. Linear Regression이란?? Linear Regression이란 예측 함수가 입력 feature들의 선형 조합으로..
-
머신러닝 - Performance Metrics (평가지표)머신러닝 & 딥러닝/머신러닝 기초 2024. 1. 24. 14:17
머신러닝 모델 평가 Bias와 Variance를 이해하면서 머신러닝의 목표는 Generalization error와 Training error를 최소화 하는 것이라고 이해했다. 그럼 머신러닝 모델을 평가하기 위해서는 어떻게 해야할까? 머신러닝은 크게 지도학습, 비지도학습, 강화학습로 구분할 수 있었다. 그 중 지도학습은 Classification, Regression으로 나눌 수 있었다. Classification 평가를 위해 여러가지 평가지표들이 있는데 이것들에 대해서 간단히 알아보자. 성능측정 머신러닝 모델 성능을 측정하기 위해 우리는 예측 값들이 결과 값들과 얼마나 근사한지 측정해야한다. Confusion Matrix를 사용해서 실제 라벨과 예측 라벨의 일치 개수를 matrix로 표현할 수 있다. ..
-
머신러닝 - 지도학습, 비지도학습, 강화학습머신러닝 & 딥러닝/머신러닝 기초 2024. 1. 22. 13:13
머신러닝이란?? 머신러닝이란 사람이 모든 조건을 코딩해서 기계에게 알려주는 것 대신에 기계가 데이터로부터 학습하여 실행할 수 있도록 하는 알고리즘을 연구하는 분야이다. 즉, 컴퓨터 시스템이 데이터를 학습할 수 있는 능력을 부여하는 것이라고 말할 수 있다. 머신러닝의 종류에는 지도학습, 비지도학습, 강화학습, 준지도학습이 있다. 그 중 지도학습, 비지도학습, 강화학습의 개념에 대해서 간단히 알아보자. 지도학습이란? 지도학습은 Classification, Regression으로 나뉜다. Classification은 다양한 파라미터를 기반으로 데이터셋들을 클래스로 분할하는데 도움이 되는 함수를 찾는 것이다. Regression은 변수 집합 X가 주어지면 Y를 예측하는 것이다. 여기서 Y는 Numeric이다. ..
-
머신러닝 - Bias and Variance trade-off머신러닝 & 딥러닝/머신러닝 기초 2024. 1. 9. 13:53
머신러닝에서 underfitting과 overfitting이란 좋은 머신러닝 모델은 학습 결과와 테스트 결과와의 차이가 적어야한다. 모델이 너무 단순하면 높은 bias로 underfitting 되며 모델이 너무 복잡하면 높은 variance로 overfitting된다. underfitting이란 모델이 너무 단순해서 부족하게 학습되는 것을 뜻한다. 이 경우는 단순히 모델을 교체해주면 되므로 큰 문제가 되지는 않는다. overfitting이란 학습 데이터에서 높은 성능을 보이지만 테스트 데이터에서 낮은 성능을 보이는 것을 뜻한다. 이 경우는 hyper-parameter를 조정하는 등의 방식으로 모델을 개선할 수 있다. Traning error는 학습 데이터 셋에서 발생하는 에러이며 Generalizatio..