μ΄λ²μλ Fine-Tuning (νμΈνλ)μ λ°νμ¬ νλ² μμλ³΄κ² μ΅λλ€.
νμΈνλ(Finetuning)μ λ₯λ¬λκ³Ό LLM λͺ¨λμμ λ리 μ¬μ©λλ λ°©λ²λ‘ μΌλ‘, μ΄λ―Έ μ¬μ νμ΅λ λͺ¨λΈμ νΉμ μμ μ λ§κ² μΆκ° νμ΅μν€λ κ³Όμ μ μλ―Έν©λλ€. νμΈνλμ κΈ°λ³Έμ μΌλ‘ λμΌν μ리λ₯Ό 곡μ ν©λλ€.
Fine-Tuning?
Fine-Tuning(νμΈνλ)μ μ¬μ νμ΅(Pre-training)λ λͺ¨λΈμ νΉμ ν μμ μ λ§κ² μΆκ°λ‘ νμ΅νλ κ³Όμ μ λλ€.
μ¬μ νμ΅ λ¨κ³μμλ λͺ¨λΈμ΄ μΌλ°μ μΈ ν¨ν΄μ νμ΅νκ³ , νμΈνλ λ¨κ³μμλ μ΄ λͺ¨λΈμ νΉμ ν λͺ©μ μ λ§μΆ° μ΅μ νν©λλ€.
μ΄λ―Έ μ¬μ νμ΅μ ν΅ν΄ νμ΅λ λͺ¨λΈμ μΌλ°μ μΈ μ§μμ νμ©νμ¬, μλ‘μ΄ μμ μ΄λ λ°μ΄ν°μ μ λΉ λ₯΄κ² μ μνλ κ²μ΄ λͺ©νμ λλ€.
Pre-Training vs Fine-Tuning
κ·Έλ¬λ©΄ Fine-Tuningμ λ°νμ¬ μμ보μμΌλ, Pre-Training(μ¬μ νμ΅)κ³Όμ μ°¨μ΄μ μ νλ² λ³΄κ² μ΅λλ€.
Pre-training (μ¬μ νμ΅)
λ₯λ¬λ λ° LLM 곡ν΅μ
- λ§€μ° ν° κ·λͺ¨μ λ°μ΄ν°μ μ μ¬μ©νμ¬ λͺ¨λΈμ΄ λ€μν ν¨ν΄, ꡬ쑰, νΉμ§μ νμ΅νλ λ¨κ³μ λλ€.
- μ΄λ―Έμ§, ν μ€νΈ λ± λ€μν λ°μ΄ν° νμ μ λν΄ μΌλ°μ μΈ ννμ νμ΅ν©λλ€.
λ₯λ¬λ
- μ΄λ―Έμ§ λΆλ₯λ₯Ό μν CNN, 물체 μΈμμ μν R-CNN λ±μμ μ΄λ―Έμ§λ·(ImageNet) κ°μ λκ·λͺ¨ λ°μ΄ν°μ μ μ¬μ©νμ¬ κΈ°λ³Έμ μΈ μκ°μ νΉμ§μ νμ΅ν©λλ€.
LLM
- μμμ΅ κ°μ λ¨μ΄λ‘ μ΄λ£¨μ΄μ§ λκ·λͺ¨ ν μ€νΈ λ°μ΄ν°μ μ μ¬μ©νμ¬ μΈμ΄μ μΌλ°μ μΈ κ΅¬μ‘°μ ννμ νμ΅ν©λλ€.
Finetuning (νμΈνλ)
λ₯λ¬λ λ° LLM 곡ν΅μ
- μ¬μ νμ΅λ λͺ¨λΈμ νΉμ μμ μ λ§κ² μΆκ° νμ΅μν€λ λ¨κ³μ λλ€.
- νΉμ μμ μ λν λ°μ΄ν°μ μ μ¬μ©νμ¬ λͺ¨λΈμ κ°μ€μΉλ₯Ό μ‘°μ νλ©°, μ¬μ νμ΅μμ λ°°μ΄ μΌλ°μ μΈ ν¨ν΄μ νΉμ ν λ¬Έμ λ‘ μΈλ°νκ² μ‘°μ ν©λλ€.
λ₯λ¬λ
- μ¬μ νμ΅λ μ΄λ―Έμ§ λΆλ₯ λͺ¨λΈμ νΉμ λλ©μΈ(μ: μλ£ μ΄λ―Έμ§ μ§λ¨)μ λ§κ² νμΈνλνμ¬ ν΄λΉ λΆμΌμμμ μ νλλ₯Ό ν₯μμν΅λλ€.
LLM
- μ¬μ νμ΅λ μΈμ΄ λͺ¨λΈμ κ°μ λΆμ, λ²μ, μ§λ¬Έ μλ΅ λ±μ μμ μ λ§κ² νμΈνλνμ¬ ν΄λΉ μμ μμμ μ±λ₯μ λμ λλ€.
Fine-Tuning(νμΈνλ)μ νμμ±
κ·Έλ¬λ©΄ AI Modelμ μ Fine-Tuning(νμΈνλ)μ΄ νμν κΉμ?
- μ¬μ νμ΅λ λͺ¨λΈμ μ΄λ―Έ μΆ©λΆν μΌλ°μ μΈ ν¨ν΄μ νμ΅νκΈ° λλ¬Έμ, νμΈνλμ μλμ μΌλ‘ μ μ μμ λ°μ΄ν°λ‘λ λμ μ±λ₯μ λ°νν μ μμ΅λλ€. μ΄λ λ₯λ¬λκ³Ό LLM λͺ¨λμ μ μ©λ©λλ€.
- Pre-Training(μ¬μ νμ΅)λ¨κ³μλ λκ·λͺ¨ λ°μ΄ν°μ μ»΄ν¨ν μμμ΄ νμνμ§λ§, Fine-Tuning(νμΈνλ)μ μλμ μΌλ‘ μ μ μμμΌλ‘ μνν μ μμ΅λλ€.
- λͺ¨λΈμ΄ μ΄λ―Έ νμ΅ν μ§μμ νΉμ μμ μΌλ‘ μ μ΄(transfer)νμ¬ λΉ λ₯΄κ² μλ ΄νκ³ μ’μ μ±λ₯μ λ¬μ±ν μ μμ΅λλ€.
Fine-Tuning(νμΈνλ)μ μ₯λ¨μ
κ·Έλ¬λ©΄ Fine-Tuning(νμΈνν )μ νμμ±μ μμμΌλ©΄ μ₯λ¨μ μ λ°νμ¬ μμλ³ΌκΉμ?
μ₯μ
- λμ μ±λ₯: νΉμ μμ μ μ΅μ νλ μ±λ₯μ μ 곡ν©λλ€. μ΄λ λ₯λ¬λμμ μ΄λ―Έμ§ λΆλ₯, LLMμμ ν μ€νΈ μμ± λ±μμ λͺ¨λ μ μ©λ©λλ€.
- μ μ λ°μ΄ν° λ° μμ: νμΈνλμ μλμ μΌλ‘ μ μ λ°μ΄ν°μ μμμΌλ‘λ μ’μ μ±λ₯μ λΌ μ μμ΅λλ€.
- λΉ λ₯Έ νμ΅ μλ: μ μ΄ νμ΅μ ν΅ν΄ λΉ λ₯Έ μλ ΄ μλλ₯Ό μ»μ μ μμ΅λλ€.
λ¨μ
- λ°μ΄ν°μ νμ§: μλͺ»λ λ°μ΄ν°μ μΌλ‘ νμΈνλμ μννλ©΄ λͺ¨λΈμ μ±λ₯μ΄ μ νλ μ μμ΅λλ€.
- κ³Όμ ν©(Overfitting): νμΈνλ μ κ³Όμ ν©μ μνμ΄ μμΌλ©°, μ΄λ‘ μΈν΄ λͺ¨λΈμ μΌλ°ν λ₯λ ₯μ΄ λ¨μ΄μ§ μ μμ΅λλ€.
- μ§μ μμ: νμΈνλ κ³Όμ μμ λͺ¨λΈμ΄ μλ νμ΅ν μΌλ°μ μΈ μ§μμ μμ μ μμ΅λλ€.
λ€μν Fine-Tuning(νμΈνλ) λ°©λ²
Fine-Tuning(νμΈνλ)μλ λ€μν λ°©λ²μ΄ μμ΅λλ€. νλ² μμλ³ΌκΉμ?
Instruction Fine-Tuning (LLM μ€μ¬)
- LLM: λͺ¨λΈμκ² νΉμ μμ μ΄λ λͺ©νλ₯Ό λͺ ννκ² μ§μ(Instruction)νμ¬ νμ΅μ μ λνλ λ°©λ²μ λλ€. "λ€μ λ¬Έμ₯μ λ²μνμμ€"μ κ°μ λͺ νν μ§μλ₯Ό ν¬ν¨ν λ°μ΄ν°μ μ μ¬μ©ν©λλ€.
Full Fine-Tuning (곡ν΅)
- λ₯λ¬λ λ° LLM: μ¬μ νμ΅λ λͺ¨λΈ μ 체λ₯Ό νΉμ μμ μ λ°μ΄ν°μ μΌλ‘ νμ΅μν€λ λ°©λ²μ λλ€. λͺ¨λΈμ λͺ¨λ νλΌλ―Έν°λ₯Ό μ‘°μ νμ¬ μμ μ λ§κ² μ΅μ νν©λλ€.
Parameter-Efficient Fine-Tuning (PEFT)
- 곡ν΅: λͺ¨λΈμ μΌλΆ νλΌλ―Έν°λ§ μ‘°μ νμ¬ νμ΅ λΉμ©κ³Ό μκ°μ μ€μ΄λ λ°©λ²μ λλ€. μ£Όμ λ μ΄μ΄λ νΉμ νλΌλ―Έν°λ§ μ‘°μ νκ³ λλ¨Έμ§λ κ³ μ ν©λλ€.
- LLM: PEFTλ₯Ό ν΅ν΄ λκ·λͺ¨ μΈμ΄ λͺ¨λΈμμ νΉμ μμ μ λ ν¨μ¨μ μΌλ‘ μνν©λλ€.
Supervised Fine-tuning (SFT)
- 곡ν΅: μ§λ νμ΅μ ν΅ν΄ λͺ¨λΈμ νΉμ μμ μ λ§κ² νμ΅μν€λ λ°©λ²μ λλ€. λΌλ²¨λ§λ λ°μ΄ν°μ μ μ¬μ©νμ¬ νμ΅μ μ§νν©λλ€.
LLMμ΄ μꡬνλ VRAM (λΉλμ€ λ©λͺ¨λ¦¬)
λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ νμ΅, νμΈνλ, μΆλ‘ (Inference) λ¨κ³μμ λ§μ μμ VRAMμ μꡬν©λλ€.
κ° λ¨κ³μμ νμν VRAM μ©λμ μ¬λ¬ μμΈμ μν΄ κ²°μ λ©λλ€.
λ€μμ κ° λ¨κ³μμ VRAM μꡬ μ¬νμ μν₯μ λ―ΈμΉλ μ£Όμ μμλ€μ λλ€.
Training (νμ΅ λ¨κ³)
- μꡬ μ¬ν: νμ΅ λ¨κ³μμλ κ°μ₯ λ§μ VRAMμ΄ νμν©λλ€. λͺ¨λΈμ νλΌλ―Έν° μ, λ°μ΄ν°μ μ ν¬κΈ°, λ°°μΉ ν¬κΈ°, μνμ€ κΈΈμ΄, κ·ΈλΌλμΈνΈ λ° μ΅ν°λ§μ΄μ μν λ±μ΄ VRAM μ¬μ©λμ κ²°μ ν©λλ€.
- μ£Όμ μμ:
- λ°μ΄ν°μ ν¬κΈ°: νμ΅ λ°μ΄ν°μ μ΄ ν΄μλ‘ λ λ§μ VRAMμ΄ νμν©λλ€. νΉν λ°°μΉ(batch) λ¨μλ‘ λ°μ΄ν°λ₯Ό μ²λ¦¬νκΈ° λλ¬Έμ, λ°°μΉ ν¬κΈ°(batch size)μ λ°λΌ νμν VRAMμ΄ μ¦κ°ν©λλ€.
- λ°°μΉ ν¬κΈ°: ν λ²μ μ²λ¦¬νλ λ°μ΄ν°μ κ°μλ₯Ό μλ―Ένλ©°, λ°°μΉ ν¬κΈ°κ° ν΄μλ‘ λ©λͺ¨λ¦¬ μ¬μ©λμ΄ μ¦κ°ν©λλ€.
- μνμ€ κΈΈμ΄: λͺ¨λΈμ΄ ν λ²μ μ²λ¦¬νλ μ λ ₯ μνμ€μ κΈΈμ΄λ‘, μνμ€ κΈΈμ΄κ° κΈΈμλ‘ VRAM μ¬μ©λμ΄ μ¦κ°ν©λλ€.
- λͺ¨λΈ νλΌλ―Έν°: λͺ¨λΈμ ν¬κΈ°, μ¦ νλΌλ―Έν°μ μκ° λ§μμλ‘ VRAMμ΄ λ λ§μ΄ νμν©λλ€. GPT-3μ κ°μ λκ·λͺ¨ λͺ¨λΈμ μμμ΅ κ°μ νλΌλ―Έν°λ₯Ό κ°μ§λ©°, μ΄ νλΌλ―Έν°λ€μ νμ΅νκ³ μ λ°μ΄νΈνκΈ° μν΄ λλμ VRAMμ΄ νμν©λλ€.
- κ·ΈλΌλμΈνΈ λ° μ΅ν°λ§μ΄μ μν: νμ΅ μ€μλ κ·ΈλΌλμΈνΈ κ³μ° λ° μ΅ν°λ§μ΄μ μνλ₯Ό μ μ₯ν΄μΌ νλ―λ‘, μ΄ λΆλΆλ μΆκ°μ μΈ VRAMμ μꡬν©λλ€.
Fine-tuning (νμΈνλ λ¨κ³)
- μꡬ μ¬ν: νμΈνλ λ¨κ³μμλ μ 체 νμ΅μ λΉν΄ μ μ VRAMμ΄ νμνμ§λ§, μ¬μ ν μλΉν μμ λ©λͺ¨λ¦¬λ₯Ό μꡬν©λλ€. νμΈνλμ μ¬μ νμ΅λ λͺ¨λΈμ νΉμ μμ μ λ§κ² μ‘°μ νλ κ³Όμ μ΄λ―λ‘, λͺ¨λΈμ ν¬κΈ°μ κ·ΈλΌλμΈνΈ λ° μ΅ν°λ§μ΄μ μνμ λ°λΌ VRAM μꡬ μ¬νμ΄ κ²°μ λ©λλ€.
- μ£Όμ μμ:
- λͺ¨λΈ ν¬κΈ°: νμΈνλνλ €λ λͺ¨λΈμ ν¬κΈ°κ° ν΄μλ‘ λ λ§μ VRAMμ΄ νμν©λλ€. GPT-3μ κ°μ λκ·λͺ¨ λͺ¨λΈμ νμΈνλν λλ μ¬μ ν λ§μ VRAMμ΄ μꡬλ©λλ€.
- κ·ΈλΌλμΈνΈ λ° μ΅ν°λ§μ΄μ μν: νμ΅ λ¨κ³μ λ§μ°¬κ°μ§λ‘ νμΈνλ μμλ κ·ΈλΌλμΈνΈ κ³μ°κ³Ό μ΅ν°λ§μ΄μ μνλ₯Ό μ μ₯ν΄μΌ ν©λλ€.
- PEFT (Parameter-Efficient Fine-Tuning): PEFTμ κ°μ νΉμ νμΈνλ λ°©λ²μ μ¬μ©νλ©΄ λͺ¨λΈμ μΌλΆ νλΌλ―Έν°λ§ μ‘°μ νμ¬ VRAM μ¬μ©λμ μ€μΌ μ μμ΅λλ€. μλ₯Ό λ€μ΄, μ 체 λͺ¨λΈμ νμΈνλνλ λμ , νΉμ λ μ΄μ΄λ νλΌλ―Έν°λ§ μ‘°μ νμ¬ λ©λͺ¨λ¦¬ μꡬ μ¬νμ μ΅μ νν μ μμ΅λλ€.
Inference (μΆλ‘ λ¨κ³)
- μꡬ μ¬ν: μΆλ‘ λ¨κ³μμλ νμ΅ λ¨κ³λ³΄λ€ μ μ VRAMμ΄ νμνμ§λ§, μ¬μ ν λͺ¨λΈμ ν¬κΈ°μ μ λ ₯ λ°μ΄ν°μ λ°λΌ μλΉν VRAMμ΄ νμν μ μμ΅λλ€. μ΄ λ¨κ³μμλ λͺ¨λΈμ΄ μ£Όμ΄μ§ μ λ ₯μ λν΄ μμΈ‘μ μμ±νκΈ° μν μ°μ°μ μνν©λλ€.
- μ£Όμ μμ:
- λͺ¨λΈ ν¬κΈ°: μΆλ‘ μμλ λͺ¨λΈ νλΌλ―Έν°λ₯Ό λ‘λνμ¬ λ©λͺ¨λ¦¬μ μ μ§ν΄μΌ ν©λλ€. λͺ¨λΈμ΄ ν΄μλ‘ λ λ§μ VRAMμ΄ νμν©λλ€.
- λ°°μΉ ν¬κΈ°: μΆλ‘ λ¨κ³μμλ λ°°μΉ μ²λ¦¬λ₯Ό μ¬μ©ν μ μμΌλ©°, ν λ²μ μ²λ¦¬νλ μ λ ₯μ κ°μμ λ°λΌ VRAM μ¬μ©λμ΄ λ¬λΌμ§λλ€.
- μνμ€ κΈΈμ΄: μ λ ₯ μνμ€μ κΈΈμ΄κ° κΈΈμλ‘ μΆλ‘ μ νμν VRAMμ΄ μ¦κ°ν©λλ€. νΉν, μΈμ΄ λͺ¨λΈμ κ²½μ° μ λ ₯ λ¬Έμ₯μ κΈΈμ΄μ λ°λΌ λ©λͺ¨λ¦¬ μ¬μ©λμ΄ λ¬λΌμ§λλ€.
Training: κ°μ₯ λ§μ VRAMμ μꡬνλ©°, λͺ¨λΈ νλΌλ―Έν° μ, λ°°μΉ ν¬κΈ°, μνμ€ κΈΈμ΄, κ·ΈλΌλμΈνΈ λ° μ΅ν°λ§μ΄μ μνμ μν΄ VRAM μ¬μ©λμ΄ κ²°μ λ©λλ€.
Finetuning: νμ΅λ³΄λ€λ μ μ VRAMμ΄ νμνμ§λ§, μ¬μ ν μλΉν μ©λμ΄ μꡬλ©λλ€. PEFTμ κ°μ λ°©λ²μ ν΅ν΄ VRAM μꡬ μ¬νμ μ€μΌ μ μμ΅λλ€.
Inference: νμ΅κ³Ό νμΈνλ λ¨κ³λ³΄λ€λ μ μ VRAMμ΄ νμνμ§λ§, λͺ¨λΈ ν¬κΈ°μ λ°°μΉ ν¬κΈ°, μνμ€ κΈΈμ΄μ λ°λΌ VRAM μ¬μ©λμ΄ λ¬λΌμ§λλ€.
'π₯οΈ Deep Learning' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[DL] Quantization(μμν), LoRA & QLoRA (0) | 2024.09.18 |
---|---|
[DL] Model Distillation (λͺ¨λΈ μ¦λ₯) (0) | 2024.09.18 |
[DL] Deep Learning Model Optimization (λ₯λ¬λ λͺ¨λΈ μ΅μ ν) (0) | 2024.08.31 |
[DL] Transfer Learning - μ μ΄ νμ΅ (0) | 2024.05.19 |
[DL] λνμ μΈ CNN Network - LeNet 5, AlexNet, ZFNet, VGGNet, GoogLeNet, ResNet (0) | 2024.05.16 |