λ°μν
μ΄λ²μλ μ°κ΄ κ·μΉ νμ΅ (Association Rule Learning)μ λ°νμ¬ νλ² μμλ³΄κ² μ΅λλ€.
μ°κ΄ κ·μΉ νμ΅μ λ°μ΄ν°λ² μ΄μ€μμ νλͺ© κ°μ ν₯λ―Έλ‘μ΄ κ΄κ³λ₯Ό μ°Ύλ λΉμ§λ νμ΅ λ°©λ²μ λλ€.
μ΄ λ°©λ²μ νΉμ νλͺ©μ΄ λνλ λ λ€λ₯Έ νλͺ©μ΄ ν¨κ» λνλ νλ₯ μ κ³μ°νμ¬ μ μ©ν ν¨ν΄μ λμΆνλ λ° μ¬μ©λ©λλ€.
μ£Όλ‘ Apriori μκ³ λ¦¬μ¦κ³Ό FP-Growth μκ³ λ¦¬μ¦μ΄ λ리 μ¬μ©λ©λλ€.
μ°κ΄ κ·μΉ νμ΅ (Association Rule Learning)μ νΉμ§
μ°κ΄ κ·μΉ νμ΅μ νΉμ§λ€μ λ°νμ¬ μμλ³΄κ² μ΅λλ€.
- λΉλ° νλͺ© μ§ν© κΈ°λ°: μ°κ΄ κ·μΉ νμ΅μ λΉλ° νλͺ© μ§ν©μ κΈ°λ°μΌλ‘ μ μλ―Έν μ°κ΄ κ·μΉμ λμΆν©λλ€. λΉλ° νλͺ© μ§ν©μ μΌμ λΉλ μ΄μ λνλλ νλͺ©λ€μ μ§ν©μ μλ―Έν©λλ€.
- κ³μ° ν¨μ¨μ±: Aprioriμ FP-Growth μκ³ λ¦¬μ¦μ ν΅ν΄ λκ·λͺ¨ λ°μ΄ν°μ μμλ μ°κ΄ κ·μΉμ ν¨μ¨μ μΌλ‘ νμν μ μμ΅λλ€.
- μμ© κ°λ₯μ±: μ°κ΄ κ·μΉ νμ΅μ λ§μΌν , μν λ°°μΉ, μΆμ² μμ€ν λ± λ€μν λΆμΌμμ μ μ©νκ² νμ©λ©λλ€.
μ°κ΄ κ·μΉ νμ΅ (Association Rule Learning)μ μ£Όμμ©μ΄
- νλͺ© (Item): λ°μ΄ν°λ² μ΄μ€ λ΄μ λ¨μΌ νλͺ©, μλ₯Ό λ€μ΄ μνΌλ§μΌμμ νΉμ μνμ μλ―Έν©λλ€.
- νλͺ© μ§ν© (Itemset): μ¬λ¬ νλͺ©μΌλ‘ ꡬμ±λ μ§ν©μΌλ‘, μλ₯Ό λ€μ΄ μ₯λ°κ΅¬λμ λ΄κΈ΄ μ¬λ¬ μνλ€μ΄ νλͺ© μ§ν©μ ꡬμ±ν©λλ€.
- κ±°λ (Transaction): νλͺ© μ§ν©μ ν¬ν¨νλ λ¨μΌ λ°μ΄ν° νμ μλ―Ένλ©°, ν λ²μ ꡬ맀 λ΄μμ΄ νλμ κ±°λλ‘ κ°μ£Όλ©λλ€.
- λΉλ° νλͺ© μ§ν© (Frequent Itemset): νΉμ μ§μ§λ κΈ°μ€μ μΆ©μ‘±νλ νλͺ© μ§ν©μΌλ‘, μλ₯Ό λ€μ΄ μμ£Ό ν¨κ» ꡬ맀λλ μνλ€μ μ§ν©μ λλ€.
- μ§μ§λ (Support): νΉμ νλͺ© μ§ν©μ΄ λ°μ΄ν°λ² μ΄μ€μμ λνλλ λΉλλ‘, νλͺ© μ§ν©μ μΈκΈ°λ₯Ό λνλ λλ€.
- μ λ’°λ (Confidence): νλͺ© μ§ν© Aκ° μ£Όμ΄μ‘μ λ νλͺ© μ§ν© Bκ° λ°μν νλ₯ λ‘, μ°κ΄ κ·μΉμ κ°λλ₯Ό λνλ λλ€.
- ν₯μλ (Lift): νλͺ© μ§ν© Aμ Bκ° λ 립μ μΌ λμ λΉν΄ μ€μ λ‘ μΌλ§λ λ μμ£Ό ν¨κ» λνλλμ§λ₯Ό λνλ λλ€. ν₯μλλ κ·μΉμ μ μλ―Έμ±μ νκ°νλ λ° μ¬μ©λ©λλ€.
μ°κ΄ κ·μΉ νμ΅ (Association Rule Learning)μ κΈ°λ³Έ μ리
κ·Έλ¬λ©΄ μ°κ΄ κ·μΉ νμ΅μ κΈ°λ³Έ μ리λ μ΄λ ν κ²λ€μ΄ μμκΉμ?
λΉλ° νλͺ© μ§ν© νμ
- μ΅μ μ§μ§λ μ€μ : λΆμμ κΈ°μ€μ΄ λλ μ΅μ μ§μ§λλ₯Ό μ€μ νμ¬, μΌλ§λ μμ£Ό λ±μ₯ν΄μΌ μλ―Έ μλ ν¨ν΄μΌλ‘ κ°μ£Όν μ§λ₯Ό κ²°μ ν©λλ€.
- λ¨μΌ νλͺ© μ§ν© νμ: κ° λ¨μΌ νλͺ©μ μ§μ§λλ₯Ό κ³μ°νκ³ , μ΅μ μ§μ§λλ₯Ό μΆ©μ‘±νλ νλͺ©μ μ νν©λλ€.
- μ‘°ν© νλͺ© μ§ν© νμ: λ κ° μ΄μμ νλͺ©μ μ‘°ν©νμ¬ μλ‘μ΄ νλͺ© μ§ν©μ μμ±νκ³ , μ§μ§λλ₯Ό κ³μ°ν©λλ€. μ΅μ μ§μ§λλ₯Ό μΆ©μ‘±νλ νλͺ© μ§ν©λ§μ λ¨κΈ°κ³ λλ¨Έμ§λ₯Ό μμ ν©λλ€.
- λ°λ³΅: λ μ΄μ μ΅μ μ§μ§λλ₯Ό μΆ©μ‘±νλ νλͺ© μ§ν©μ΄ μμ λκΉμ§ μ΄ λ¨κ³λ₯Ό λ°λ³΅ν©λλ€.
μ°κ΄ κ·μΉ μμ±
- λΉλ° νλͺ© μ§ν© κΈ°λ° κ·μΉ μμ±: λΉλ° νλͺ© μ§ν©μμ κ°λ₯ν λͺ¨λ μ°κ΄ κ·μΉμ μμ±ν©λλ€. μλ₯Ό λ€μ΄, {A, B}μμ A→Bμ B→Aλ₯Ό μμ±ν μ μμ΅λλ€.
- μ λ’°λμ ν₯μλ κ³μ°: μμ±λ κ·μΉμ λν΄ μ λ’°λμ ν₯μλλ₯Ό κ³μ°νμ¬ κ·μΉμ μ μλ―Έμ±μ νκ°ν©λλ€.
- μ΅μ μ λ’°λ λ° ν₯μλ κΈ°μ€ μ€μ : μ΅μ μ λ’°λμ ν₯μλλ₯Ό μ€μ νμ¬ μλ―Έ μλ κ·μΉλ§μ μ νν©λλ€.
μ°κ΄ κ·μΉ νμ΅ (Association Rule Learning)μ μ₯, λ¨μ
μ°κ΄ κ·μΉ νμ΅μ μ₯μ
- μ μ©ν ν¨ν΄ λ°κ²¬: λ°μ΄ν°μμ μ μ©ν ν¨ν΄κ³Ό κ·μΉμ λ°κ²¬νμ¬ λΉμ¦λμ€ μ λ΅ μ립μ λμμ μ€ μ μμ΅λλ€. μλ₯Ό λ€μ΄, λ§μΌν μ λ΅μ΄λ μν λ°°μΉ λ±μ νμ©ν μ μμ΅λλ€.
- λ€μν μμ© λΆμΌ: μ°κ΄ κ·μΉ νμ΅μ λ§μΌν , μΆμ² μμ€ν , μ΄μ νμ§ λ± λ€μν λΆμΌμμ μ μ© κ°λ₯μ±μ΄ λμ΅λλ€.
- λ¨μμ±κ³Ό μ΄ν΄ μ©μ΄μ±: μμ±λ κ·μΉμ΄ λͺ ννκ³ μ½κ² ν΄μλ μ μμ΄, λΉμ λ¬Έκ°λ μ½κ² μ΄ν΄νκ³ νμ©ν μ μμ΅λλ€.
μ°κ΄ κ·μΉ νμ΅μ λ¨μ
- λκ·λͺ¨ λ°μ΄ν°μ μμμ κ³μ° 볡μ‘μ±: λκ·λͺ¨ λ°μ΄ν°μ μμ λΉλ° νλͺ© μ§ν©μ νμνλ λ° λ§μ κ³μ°μ΄ νμνλ©°, μ΄λ‘ μΈν΄ μ±λ₯ μ νκ° λ°μν μ μμ΅λλ€.
- ν¬μμ± λ¬Έμ : λ°μ΄ν°κ° ν¬μν κ²½μ° μ μλ―Έν κ·μΉμ μ°ΎκΈ° μ΄λ €μΈ μ μμ΅λλ€. μ΄λ λ°μ΄ν°κ° μΆ©λΆν ν° κ²½μ°μλ§ μ’μ κ²°κ³Όλ₯Ό κΈ°λν μ μμμ μλ―Έν©λλ€.
- κ³Όμ ν©: λ무 λ§μ κ·μΉμ΄ μμ±λ κ²½μ°, λͺ¨λΈμ΄ λ°μ΄ν°μ κ³Όμ ν©λμ΄ μΌλ°ν μ±λ₯μ΄ λ¨μ΄μ§ μ μμ΅λλ€.
μ°κ΄ κ·μΉ νμ΅μ κ°μ λ°©λ²
- μκ³ λ¦¬μ¦ μ΅μ ν
- Apriori μκ³ λ¦¬μ¦μ κ²½μ°, ν보 νλͺ© μ§ν© μμ±μ μ΅μννμ¬ ν¨μ¨μ±μ λμΌ μ μμ΅λλ€.
- FP-Growth μκ³ λ¦¬μ¦μ κ²½μ°, FP-Tree ꡬ쑰λ₯Ό μ΅μ ννμ¬ νμ μλλ₯Ό ν₯μμν¬ μ μμ΅λλ€.
- λ°μ΄ν° μ μ²λ¦¬
- λ°μ΄ν° μ κ·ν, μ€λ³΅ μ κ±° λ±μ μ μ²λ¦¬ κ³Όμ μ ν΅ν΄ λ°μ΄ν°μ νμ§μ ν₯μμν¬ μ μμ΅λλ€. μ΄λ λ μλ―Έ μλ κ·μΉμ λμΆνλ λ° λμμ΄ λ©λλ€.
- νκ° μ§ν λ€μν
- μ λ’°λμ ν₯μλ μΈμλ ν₯λ―Έλ(Interestingness), μ λ’°λ μ κ³±(Confidence Squared) λ±μ λ€μν νκ° μ§νλ₯Ό μ¬μ©νμ¬ κ·μΉμ μ μλ―Έμ±μ νκ°ν μ μμ΅λλ€. μ΄λ₯Ό ν΅ν΄ λ μ ννκ³ μ μλ―Έν κ·μΉμ λμΆν μ μμ΅λλ€.
λ°μν
'π Machine Learning' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[ML] Recommender System (μΆμ²μμ€ν ) (0) | 2024.08.26 |
---|---|
[ML] Emsemble Methods (μμλΈ κΈ°λ²) (0) | 2024.08.23 |
[ML] t-SNE (t-Distributed Stochastic Neighbor Embedding) (0) | 2024.08.20 |
[ML] Isomap (μμ΄μ맡) (0) | 2024.08.20 |
[ML] Principal Component Analysis (PCA - μ£Όμ±λΆ λΆμ) (0) | 2024.08.18 |