λ°μν
μ΄λ²κΈλΆν°λ Machine Learning (λ¨Έμ λ¬λ)μ λ°νμ¬ νλ² μμ보λλ‘ νκ² μ΅λλ€.
Machine Learning μκ°
Machine Learning (κΈ°κ³νμ΅)μ 무μμΌκΉμ?
- λ¨Έμ λ¬λμ μΈκ³΅μ§λ₯μ ν λΆμΌλ‘, λ°μ΄ν°μμ ν¨ν΄μ νμ΅νκ³ μμΈ‘νκ±°λ μμ¬ κ²°μ μ λ΄λ¦¬λ μκ³ λ¦¬μ¦μ μ¬μ©ν©λλ€.
- μ¬λμ κ°μ μμ΄λ μ€μ€λ‘ μ±λ₯μ κ°μ ν μ μλ λ₯λ ₯μ κ°μ§ μμ€ν μ λλ€.
- λν μ£Όμ νΉμ§μ λ°μ΄ν°λ₯Ό ν΅ν΄ νμ΅νλ©΄μ μ§μμ μΌλ‘ μ±λ₯μ ν₯μμν€λ λͺ¨λΈμ λλ€.
- κ·Έλ¬λ©΄ νλ² μμλ₯Ό λ€μ΄μ λ¨Έμ λ¬λμ΄ μλ€λ©΄ μ΄λ»κ² λ κΉμ?
λ¨Έμ λ¬λμ΄ μλ€λ©΄? (μ€νΈλ©μΌ μμ)
- μ ν΅μ μ κ·Ό: μ€νΈμΌλ‘ μμ¬λλ λ¨μ΄μ λν λΈλ리μ€νΈλ₯Ό ꡬμΆνκ³ , μλ‘μ΄ λ¨μ΄κ° μμ λλ§λ€ μΆκ°ν©λλ€.
- μ΄ κ³Όμ μλ μ€νΈμΌλ‘ μμ¬λλ λ¨μ΄λ₯Ό μ νκΈ° μν΄ μ λ¬Έκ°κ° νμν©λλ€.
λ¨Έμ λ¬λμ΄ μλ€λ©΄? (μ€νΈλ©μΌ μμ)
- λ¨Έμ λ¬λ μ κ·Ό: μ€νΈλ©μΌμ λ¨μ΄λ€μμ ν¨ν΄μ λΆμνμ¬, μ€νΈλ©μΌμλ μμ£Ό λ±μ₯νκ³ μΌλ°λ©μΌμλ μμ£Ό λ±μ₯νμ§ μλ λ¨μ΄λ₯Ό μΆμΆν©λλ€. μ΄ κ³Όμ μμλ μ λ¬Έκ°μ κ°μ μ΄ νμνμ§ μμ΅λλ€.
λ¨Έμ λ¬λ, μΈμ μ¨μΌνμ§?
κ·Έλ¬λ©΄, λ¨Έμ λ¬λμ λλ체 μΈμ μ¨μΌ νλ 건κ°μ? ν¬κ² 3κ°μ§μ κ²½μ°μ μ¬μ©νλ€κ³ λ³Ό μ μμ΅λλ€.
- λ°μ΄ν° ν¨ν΄ λΆμ: μ¬λμ΄ μ§μ ν¨ν΄μ μ°ΎκΈ° νλ λκ·λͺ¨ λ°μ΄ν° ν¨ν΄μ λΆμν λ.
- μμΈ‘κ³Ό λΆλ₯: κΈ°μ‘΄ λ°μ΄ν°λ‘λΆν° λ―Έλλ₯Ό μμΈ‘νκ±°λ νΉμ λ²μ£Όλ‘ λΆλ₯ν΄μΌ ν λ.
- μλνλ μμ¬κ²°μ νλ‘μΈμ€: μ£Όμ΄μ§ μ λ ₯μ λ°νμΌλ‘ κΈ°λνλ μΆλ ₯μ λ°νν λ.
λ¨Έμ λ¬λ Processλ₯Ό μ§ννκΈ° μ μ νμΈν΄λ΄μΌ νλμ
Machine Learning Processλ₯Ό μ§ννκΈ° μ μ μ°λ¦¬κ° 체ν¬λ₯Ό ν΄λ΄μΌ νλ μ λ€μ΄ μ¬λ¬κ° μμ΅λλ€.
- μ΄λ€ μ§λ¬Έ(λ¬Έμ )μ λν μ΄λ€ λ΅(ν΄κ²°)μ μνλκ°? → λ¬Έμ μ μμ λͺ©ν μ€μ μ΄ λͺ νν΄μΌ ν©λλ€.
- λ΄κ° κ°κ³ μλ λ°μ΄ν°μ λ΅μ΄ μλκ°? → λ°μ΄ν°λ₯Ό λΆμνμ¬ ν΄κ²°νκ³ μ νλ λ¬Έμ μ μ ν¨νμ§ νμΈν΄μΌ ν©λλ€.
- λ°μ΄ν°κ° μΆ©λΆνκ°? → νμ΅μ νμν μΆ©λΆν μμ λ°μ΄ν°κ° ν보λμ΄μΌ ν©λλ€.
- μ΄λ€ λ°©λ²μ΄ λ΄ μ§λ¬Έμ κ°μ₯ μ ν΄κ²°ν΄ μ€ μ μλκ°? → λ€μν λ¨Έμ λ¬λ μκ³ λ¦¬μ¦ μ€ μ μ ν λ°©λ²μ μ νν΄μΌ ν©λλ€.
- λ΄κ° λ§λ λ¨Έμ λ¬λ νλ‘μΈμ€μ κ²°κ³Όλ₯Ό μ΄λ»κ² νκ°ν μ μλκ°? → λͺ¨λΈμ μ±λ₯μ νκ°ν μ μλ μ§νμ λ°©λ²μ μ¬μ μ μ μν΄μΌ ν©λλ€.
μ΄λ κ² μ°λ¦¬κ° μ΄λ ν μ¬λ‘μ λ¨Έμ λ¬λμ μ μ©νκΈ° μν΄μλ λ¬Έμ μ μ, λ°μ΄ν° ν보, μ μ ν λ°©λ² μ ν, κ·Έλ¦¬κ³ κ²°κ³Ό νκ°μ νλ‘μΈμ€λ₯Ό μ¬μ μ νμΈν΄μΌ νλ€λ μ μ΄ μμ΅λλ€.
μ£Όλ‘ μ¬μ©νλ λ¨Έμ λ¬λ Library
Numpy
Numpyλ κ³Όν κ³μ°μ μν ν΅μ¬ νμ΄μ¬ λΌμ΄λΈλ¬λ¦¬λ‘, κ³ μ±λ₯ λ€μ°¨μ λ°°μ΄ κ°μ²΄μ λ€μν μν ν¨μλ€μ μ 곡ν©λλ€.
λ¨Έμ λ¬λκ³Ό λ°μ΄ν° λΆμμ κΈ°μ΄ λΌμ΄λΈλ¬λ¦¬λ‘ λ리 μ¬μ©λ©λλ€.
μ£Όμ κΈ°λ₯
- λ€μ°¨μ λ°°μ΄ κ°μ²΄: ν¨μ¨μ μΈ λ€μ°¨μ λ°°μ΄(ndarray)λ₯Ό μ 곡ν©λλ€.
- μν ν¨μ: μ ν λμ, ν΅κ³, νΈλ¦¬μ λ³ν λ±μ μν ν¨μλ₯Ό μ 곡ν©λλ€.
- λ°°μ΄ μ‘°μ: λ°°μ΄ μμ±, λ³ν, μΈλ±μ±, μ¬λΌμ΄μ± λ±μ κΈ°λ₯μ μ 곡ν©λλ€.
- λΉ λ₯Έ κ³μ°: Cλ‘ κ΅¬νλμ΄ μμ΄ λΉ λ₯Έ κ³μ° μλλ₯Ό μ 곡ν©λλ€.
μ₯μ :
- μ±λ₯: λκ·λͺ¨ λ°μ΄ν° μ²λ¦¬λ₯Ό μν κ³ μ±λ₯ μ°μ°.
- νΈνμ±: λ€λ₯Έ κ³Όν κ³μ° λ° λ¨Έμ λ¬λ λΌμ΄λΈλ¬λ¦¬μμ νΈνμ±.
- μ¬μ©μ μ©μ΄μ±: κ°λ¨ν λ°°μ΄ μ°μ°μΌλ‘ 볡μ‘ν μν κ³μ°μ μ½κ² μν.
Pandas
Pandasλ λ°μ΄ν° μ‘°μκ³Ό λΆμμ μν κ³ μ±λ₯ λΌμ΄λΈλ¬λ¦¬λ‘, μ¬μ©μ΄ κ°νΈν λ°μ΄ν° ꡬ쑰μ λ°μ΄ν° λΆμ λꡬλ₯Ό μ 곡ν©λλ€.
μ£Όλ‘ λ°μ΄ν° μ μ²λ¦¬μ νμμ λ°μ΄ν° λΆμ(EDA)μ μ¬μ©λ©λλ€.
μ£Όμ κΈ°λ₯
- λ°μ΄ν° νλ μ: νκ³Ό μ΄λ‘ ꡬμ±λ 2μ°¨μ λ°μ΄ν° ꡬ쑰λ₯Ό μ 곡ν©λλ€.
- λ°μ΄ν° μ‘°μ: λ°μ΄ν° μ μ , κ²°μΈ‘κ° μ²λ¦¬, λ°μ΄ν° λ³ν© λ° λΆν λ± λ€μν κΈ°λ₯μ μ 곡ν©λλ€.
- λ°μ΄ν° λ³ν: λ°μ΄ν° μ λ ¬, νν°λ§, μ§κ³ λ±μ κΈ°λ₯μ μ 곡ν©λλ€.
- μκ° μκ³μ΄ λΆμ: λ μ§ λ° μκ° λ°μ΄ν°λ₯Ό λ€λ£¨λ κΈ°λ₯μ΄ μμ΅λλ€.
μ₯μ
- λ€μν κΈ°λ₯: λ°μ΄ν° λΆμκ³Ό μ μ²λ¦¬λ₯Ό μν νλΆν κΈ°λ₯μ μ 곡ν©λλ€.
- νΈνμ±: λ€λ₯Έ νμ΄μ¬ λΌμ΄λΈλ¬λ¦¬(Numpy, Scikit-Learn λ±)μμ νΈνμ±μ΄ μ°μν©λλ€.
Scikit-Learn
Scikit-Learnμ νμ΄μ¬μμ κ°μ₯ λ리 μ¬μ©λλ λ¨Έμ λ¬λ λΌμ΄λΈλ¬λ¦¬λ‘, κ°λ¨νκ³ μΌκ΄λ μΈν°νμ΄μ€λ₯Ό μ 곡νλ©° λ€μν μκ³ λ¦¬μ¦μ ν¬ν¨νκ³ μμ΅λλ€.
μ£Όμ κΈ°λ₯
- λ°μ΄ν° μ μ²λ¦¬: κ²°μΈ‘κ° μ²λ¦¬, λ°μ΄ν° μ€μΌμΌλ§, μ°¨μ μΆμ λ±μ ν¬ν¨ν©λλ€.
- μ§λνμ΅ μκ³ λ¦¬μ¦: μ ννκ·, λ‘μ§μ€ν± νκ·, μν¬νΈ λ²‘ν° λ¨Έμ , μμ¬κ²°μ λ무, λλ€ ν¬λ μ€νΈ, k-NN λ±.
- λΉμ§λνμ΅ μκ³ λ¦¬μ¦: k-means, PCA, DBSCAN λ±.
- λͺ¨λΈ νκ° λ° μ ν: κ΅μ°¨ κ²μ¦, νμ΄νΌνλΌλ―Έν° νλ, λ€μν νκ° μ§ν.
μ₯μ
- νλΆν λ¬Έμν: κ΄λ²μν λ¬Έμμ μμ μ½λκ° μ 곡λμ΄ νμ΅κ³Ό μ μ©μ΄ μ©μ΄ν©λλ€.
- νμ₯μ±: λ€λ₯Έ νμ΄μ¬ λΌμ΄λΈλ¬λ¦¬(Numpy, Pandas λ±)μμ νΈνμ±μ΄ μ’μ΅λλ€.
λ¨Έμ λ¬λ Library Example Code
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# λ°μ΄ν° μμ±
from sklearn.datasets import load_iris
from sklearn.datasets import load_digits
from sklearn.datasets import load_breast_cancer
# λ°μ΄ν° μμ±
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)
from sklearn.model_selection import train_test_split
# λ°μ΄ν° λΆν
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
print(f"len(X_train): {len(X_train)}")
# len(X_train): 80
νμ΅λ°©λ²κ³Ό λ¨Έμ λ¬λ
Machine Learningμ νμ΅λ°©μμ ν¬κ² 3κ°κ° μμ΅λλ€. μ§λνμ΅, λΉμ§λνμ΅, κ°ννμ΅ 3κ°μ§κ° μλλ° νλνλ μ€λͺ ν΄ λ³΄κ² μ΅λλ€.
μ§λνμ΅ (Supervised Learning)
μ§λνμ΅ (Supervised Learning)μ λ μ΄λΈ(μ λ΅)μ΄ μλ λ°μ΄ν°λ₯Ό μ¬μ©νμ¬ λͺ¨λΈμ νμ΅μμΌ μλ‘μ΄ λ°μ΄ν°μ λν μμΈ‘μ μννλ λ°©λ²μ λλ€. μ λ ₯κ³Ό μΆλ ₯ κ°μ κ΄κ³λ₯Ό νμ΅νμ¬ μλ‘μ΄ μ λ ₯ λ°μ΄ν°μ λν μμΈ‘μ΄ κ°λ₯ν©λλ€.
μμ
- μ΄λ©μΌ μ€νΈ νν°λ§: μ€νΈκ³Ό μΌλ° μ΄λ©μΌλ‘ λΌλ²¨λ§λ λ°μ΄ν°λ₯Ό μ¬μ©νμ¬ νμ΅λ λͺ¨λΈμ μλ‘μ΄ μ΄λ©μΌμ΄ μ€νΈμΈμ§ μλμ§ λΆλ₯ν©λλ€..
- μ£Όμ κ°κ²© μμΈ‘: κ³Όκ±° μ£Όμ κ°κ²© λ°μ΄ν°μ μ€μ μ£Όμ κ°κ²©μ μ΄μ©νμ¬ νμ΅ν λͺ¨λΈμ λ―Έλμ μ£Όμ κ°κ²©μ μμΈ‘ν©λλ€..
μ£Όμ μκ³ λ¦¬μ¦
- μ ννκ· (Linear Regression): λ λ³μ κ°μ μ ν κ΄κ³λ₯Ό λͺ¨λΈλ§.
- λ‘μ§μ€ν± νκ· (Logistic Regression): μ΄μ§ λΆλ₯ λ¬Έμ λ₯Ό ν΄κ²°.
- μμ¬κ²°μ λ무 (Decision Tree): λ°μ΄ν°μ νΉμ±μ λ°λΌ μμ¬κ²°μ μ νΈλ¦¬ κ΅¬μ‘°λ‘ λͺ¨λΈλ§.
- k-NN (k-Nearest Neighbors): κ°μ₯ κ°κΉμ΄ kκ°μ μ΄μ λ°μ΄ν°λ₯Ό κΈ°λ°μΌλ‘ μμΈ‘.
μ₯μ
- λͺ νν λͺ©ν: μ λ΅(λ μ΄λΈ)μ΄ λͺ νν μ‘΄μ¬νλ―λ‘ λͺ¨λΈμ νμ΅ λͺ©νκ° λΆλͺ ν©λλ€.
- λ€μν μμ© λΆμΌ: λΆλ₯, νκ· λ± λ€μν λ¬Έμ μ μ μ©μ΄ κ°λ₯ν©λλ€.
- λμ μ±λ₯: μΆ©λΆν μμ§μ λ°μ΄ν°κ° μ 곡λ κ²½μ° λμ μμΈ‘ μ±λ₯μ λ°νν©λλ€.
λ¨μ :
- λ°μ΄ν° μμ‘΄μ±: κ³ νμ§μ λΌλ²¨λ§λ λ°μ΄ν°κ° λ§μ΄ νμν©λλ€.
- κ³Όμ ν© (Overfitting): νλ ¨ λ°μ΄ν°μ λ무 μΉμ°μ³ νμ΅ν κ²½μ°, μλ‘μ΄ λ°μ΄ν°μ λν μΌλ°ν λ₯λ ₯μ΄ λ¨μ΄μ§ μ μμ΅λλ€.
- 볡μ‘μ± μ¦κ°: κ³ μ°¨μμ λ°μ΄ν°λ 볡μ‘ν λ¬Έμ μμλ λͺ¨λΈμ 볡μ‘λκ° κΈκ²©ν μ¦κ°ν μ μμ΅λλ€.
μ£Όμ λμ κ³Όμ :
- λ°μ΄ν° λΌλ²¨λ§: λλμ λ°μ΄ν°λ₯Ό λΌλ²¨λ§νλ κ²μ λ§μ μκ°κ³Ό λΉμ©μ΄ μμλ©λλ€.
- λ°μ΄ν° νΈν₯: λ§μ½ λΌλ²¨λ§λ λ°μ΄ν°κ° νΉμ ν¨ν΄μ μΉμ°μΉ κ²½μ°, λͺ¨λΈμ΄ νΈν₯λ μμΈ‘μ ν κ°λ₯μ±μ΄ λμ΅λλ€.
- λͺ¨λΈ ν΄μ κ°λ₯μ±: 볡μ‘ν λͺ¨λΈμΌμλ‘ μμΈ‘ κ²°κ³Όλ₯Ό ν΄μνκ³ μ€λͺ νκΈ° μ΄λ ΅μ΅λλ€.
λΉμ§λνμ΅ (Unsupervised Learning)
λΉμ§λνμ΅ (Unsupervised Learning)μ λ μ΄λΈμ΄ μλ λ°μ΄ν°μμ ν¨ν΄μ΄λ ꡬ쑰λ₯Ό λ°κ²¬νλ νμ΅ λ°©λ²μ λλ€.
λͺ©νλ λ°μ΄ν° λ΄μ μ¨κ²¨μ§ ꡬ쑰λ κ΄κ³λ₯Ό μ΄ν΄νκ³ , μ΄λ₯Ό κΈ°λ°μΌλ‘ λ°μ΄ν°μ λΆν¬λ νΉμ§μ νμ νλ κ²μ λλ€.
μμ
- κ³ κ° μΈλΆν: κ³ κ° λ°μ΄ν°λ₯Ό κ΅°μ§ννμ¬ λ§μΌν μ λ΅μ μ립ν©λλ€.
- μ΄μ νμ§: μ μ ν¨ν΄μμ λ²μ΄λ μ΄μ λ°μ΄ν°λ₯Ό μλ³ν©λλ€.
- μ°¨μ μΆμ: κ³ μ°¨μ λ°μ΄ν°λ₯Ό μ μ°¨μμΌλ‘ μΆμνμ¬ λ°μ΄ν° μκ°νλ ν¨μ¨μ μΈ λ°μ΄ν° μ²λ¦¬μ νμ©ν©λλ€.
μ£Όμ μκ³ λ¦¬μ¦:
- k-means: λ°μ΄ν°λ₯Ό kκ°μ ν΄λ¬μ€ν°λ‘ λΆν νλ κ΅°μ§ν μκ³ λ¦¬μ¦.
- PCA (Principal Component Analysis): λ°μ΄ν°μ μ°¨μμ μΆμνμ¬ μ£Όμ νΉμ§μ μΆμΆ.
- DBSCAN (Density-Based Spatial Clustering of Applications with Noise): λ°λ κΈ°λ° κ΅°μ§ν.
- κ³μΈ΅μ κ΅°μ§ν: λ°μ΄ν°μ κ³μΈ΅μ ꡬ쑰λ₯Ό νμνλ κ΅°μ§ν μκ³ λ¦¬μ¦.
μ₯μ :
- λΌλ²¨μ΄ νμ μμ: λΌλ²¨λ§λ λ°μ΄ν°κ° νμνμ§ μμ΅λλ€.
- λ°μ΄ν° νμ: λ°μ΄ν°μ μ¨κ²¨μ§ ꡬ쑰λ ν¨ν΄μ λ°κ²¬ν μ μμ΅λλ€.
- λ€μν μμ© λΆμΌ: κ΅°μ§ν, μ΄μ νμ§, μ°¨μ μΆμ λ± λ€μν λ¬Έμ μ μ μ©ν©λλ€.
λ¨μ :
- ν΄μμ μ΄λ €μ: λΉμ§λνμ΅μ κ²°κ³Όλ ν΄μνκΈ° μ΄λ €μ΄ κ²½μ°κ° λ§μ΅λλ€.
- λͺ¨λΈ νκ°μ μ΄λ €μ: μ§λνμ΅μ²λΌ λͺ νν μ λ΅μ΄ μκΈ° λλ¬Έμ, λͺ¨λΈμ μ±λ₯μ νκ°νκΈ°κ° μ΄λ ΅μ΅λλ€.
- μ΄κΈ° μ€μ λ―Όκ°λ: μ΄κΈ° νλΌλ―Έν° μ€μ μ λ°λΌ κ²°κ³Όκ° ν¬κ² λ¬λΌμ§ μ μμ΅λλ€.
μ£Όμ λμ κ³Όμ :
- μ΅μ μ νλΌλ―Έν° μ€μ : κ΅°μ§ν μκ³ λ¦¬μ¦μ κ²½μ°, μ΅μ μ ν΄λ¬μ€ν° κ°μλ λ°λ νλΌλ―Έν°λ₯Ό μ€μ νλ κ²μ΄ μ΄λ ΅μ΅λλ€.
- λκ·λͺ¨ λ°μ΄ν° μ²λ¦¬: λκ·λͺ¨ λ°μ΄ν°μ μμλ κ³μ° λΉμ©μ΄ λμμ§ μ μμ΅λλ€.
- λ Έμ΄μ¦ λ°μ΄ν° μ²λ¦¬: λ Έμ΄μ¦λ μ΄μμΉκ° λ§μ κ²½μ°, λͺ¨λΈμ μ±λ₯μ λΆμ μ μΈ μν₯μ λ―ΈμΉ μ μμ΅λλ€.
κ°ννμ΅ (Reinforcement Learning)
κ°ννμ΅ (Reinforcement Learning)μ μμ΄μ νΈ(agent)κ° νκ²½(environment)κ³Ό μνΈμμ©νλ©΄μ 보μμ μ΅λννλ νλ(policy)μ νμ΅νλ λ°©λ²μ λλ€. μνμ€ κΈ°λ°μ μμ¬κ²°μ λ¬Έμ μμ μ΅μ μ νλμ μ°Ύλ κ²μ΄ λͺ©νμ λλ€.
μμ:
- κ²μ μΈκ³΅μ§λ₯: μ€μ€λ‘ νμ΅νμ¬ μ΅μ μ μ λ΅μ μ°Ύμ΅λλ€.
- λ‘λ΄ μ μ΄: νΉμ μμ μ μννλ©΄μ νκ²½κ³Ό μνΈμμ©νμ¬ μ΅μ μ λμμ νμ΅ν©λλ€.
- μμ¨ μ£Όν: μμ¨ μ£Όν μλμ°¨κ° λλ‘ νκ²½μμ μ΅μ μ μ£Όν κ²½λ‘λ₯Ό νμ΅ν©λλ€.
κ°ννμ΅ μ£Όμκ°λ
μμ΄μ νΈ(Agent)
- μ μ: νκ²½κ³Ό μνΈμμ©νλ©° νμ΅μ μννλ 주체μ λλ€.
- κΈ°λ₯: νμ¬ μνλ₯Ό κΈ°λ°μΌλ‘ νλμ μ ννκ³ , κ·Έ νλμ κ²°κ³Όλ‘ λ³΄μμ λ°μΌλ©°, μ΄λ₯Ό ν΅ν΄ νμ΅μ μ§νν©λλ€.
νκ²½(Environment)
- μ μ: μμ΄μ νΈκ° μνΈμμ©νλ μΈλΆ μμ€ν μ λλ€.
- κΈ°λ₯: μμ΄μ νΈμ νλμ λ°λΌ μνλ₯Ό λ³νμν€κ³ 보μμ μ 곡 ν©λλ€.
μν(State)
- μ μ: νκ²½μ νμ¬ μνλ₯Ό λνλ΄λ μ 보μ λλ€.
- κΈ°λ₯: μμ΄μ νΈκ° νμ¬ μν©μ μ΄ν΄νκ³ , μ μ ν νλμ μ ννλ λ° μ¬μ©λ©λλ€.
νλ(Action)
- μ μ: μμ΄μ νΈκ° νμ¬ μνμμ μ νν μ μλ νλμ λλ€.
- κΈ°λ₯: μμ΄μ νΈλ μ£Όμ΄μ§ μνμμ νλμ μ ννκ³ , μ΄ νλμ νκ²½μ μνλ₯Ό λ³νμν΅λλ€.
보μ(Reward)
- μ μ: μμ΄μ νΈμ νλ κ²°κ³Όλ‘ μ 곡νλ νΌλλ°± μ λλ€.
- κΈ°λ₯: μμ΄μ νΈμ νλμ΄ μΌλ§λ μ’μμ§μ λν μ§νμ΄λ©°, μμ΄μ νΈλ 보μμ μ΅λννλ λ°©ν₯μΌλ‘ νμ΅ν©λλ€
μ μ± (Policy)
- μ μ: μ£Όμ΄μ§ μνμμ νλμ μ ννλ μ λ΅μ λλ€.
- κΈ°λ₯: μ μ± μ μνλ₯Ό μ λ ₯λ°μ νλμ μΆλ ₯νλ©°, μ΅μ μ μ μ± μ μμ΄μ νΈκ° μ₯κΈ°μ μΌλ‘ μ΅λ 보μμ μ»λλ‘ ν©λλ€.
κ°μΉ ν¨μ(Value Function)
- μ μ: νΉμ μνλ μν-νλ μμ κ°μΉλ₯Ό νκ°νλ ν¨μμ λλ€.
- κΈ°λ₯: κ°μΉ ν¨μλ μ₯κΈ°μ μΌλ‘ μ»μ μ μλ λμ 보μμ κΈ°λκ°μ λνλ΄λ©°, μ΅μ μ νλμ μ ννλ λ° λμμ μ€λλ€.
κ°ννμ΅μ μ₯&λ¨μ
κ°ννμ΅μ μ₯μ
- μμ°¨μ μμ¬κ²°μ λ¬Έμ ν΄κ²°: μνμ€ κΈ°λ°μ λ¬Έμ μμ μ΅μ μ νλμ μ°Ύλ λ° μ 리ν©λλ€.
- μ μμ±: λ³ννλ νκ²½μ λν΄ μ§μμ μΌλ‘ νμ΅νκ³ μ μν μ μμ΅λλ€.
κ°ννμ΅μ λ¨μ
- 볡μ‘μ±: νμ΅ κ³Όμ μ΄ λ³΅μ‘νλ©°, λ§μ κ³μ° μμμ΄ νμν©λλ€.
- 보μ μ€κ³: μ μ ν 보μ ν¨μλ₯Ό μ€κ³νλ κ²μ΄ μ΄λ €μΈ μ μμ΅λλ€.
κ°ννμ΅μ μ£Όμ λμ κ³Όμ
- 보μμ ν¬μμ±: νΉμ νλμ λν 보μμ΄ λλ¬Ό κ²½μ°, νμ΅μ΄ μ΄λ €μΈ μ μμ΅λλ€.
- κ³ μ°¨μ μν 곡κ°: μν 곡κ°μ΄ λ§€μ° ν¬κ±°λ 볡μ‘ν κ²½μ°, νμ΅μ΄ μ΄λ €μΈ μ μμ΅λλ€.
- μ₯κΈ° μμ‘΄μ± λ¬Έμ : κΈ΄ μνμ€μ μμ¬κ²°μ μμ λ°μνλ μμ‘΄μ±μ μ²λ¦¬νλ κ²μ΄ μ΄λ €μ΅λλ€.
- μμ μ±: νμ΅ κ³Όμ μ μμ μ±μ ν보νλ κ²μ΄ μ€μνλ©°, λΆμμ ν νμ΅μ μλͺ»λ μ μ± μΌλ‘ μ΄μ΄μ§ μ μμ΅λλ€.
Summary
κ°ννμ΅μ μμ΄μ νΈκ° νκ²½κ³Ό μνΈμμ©νλ©° 보μμ μ΅λννλ λ°©ν₯μΌλ‘ νμ΅νλ λ°©λ²μ λλ€.
μμ΄μ νΈ, νκ²½, μν, νλ, 보μ, μ μ± , κ°μΉ ν¨μμ κ°μ μ£Όμ κ°λ λ€μ μ΄ν΄νκ³ , μ΄λ₯Ό ν΅ν΄ μμ°¨μ μμ¬κ²°μ λ¬Έμ λ₯Ό ν΄κ²°ν μ μμ΅λλ€.
κ·Έλ¬λ 볡μ‘μ±, 보μ μ€κ³, 보μμ ν¬μμ±, κ³ μ°¨μ μν 곡κ°, μ₯κΈ° μμ‘΄μ± λ¬Έμ , μμ μ±κ³Ό κ°μ λμ κ³Όμ λ₯Ό ν΄κ²°ν΄μΌ ν©λλ€.
λ°μν
'π Machine Learning' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[ML] Supervised Learning (μ§λνμ΅) (0) | 2024.08.06 |
---|---|
[ML] Modelμ νμ΅κ³Ό νκ° (0) | 2024.08.02 |
[ML] Naive Bayes (λμ΄λΈ λ² μ΄μ¦) (0) | 2024.08.01 |
[ML] Linear Regression (μ ννκ·) (0) | 2024.08.01 |
[ML] Supervised Learning (μ§λνμ΅) (0) | 2024.07.31 |