์ด๋ฒ์๋ Quantization(์์ํ), LoRA & QLoRA์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.
Quantization(์์ํ)?
Quantization(์์ํ)๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋๊ณผ ๊ณ์ฐ ํจ์จ์ฑ์ ํฅ์์ํค๊ธฐ ์ํ ๊ธฐ์ ๋ก, ๊ณ ์ ์์์ (fixed-point) ์ซ์ ํํ์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ๊ฐ์ค์น์ ํ์ฑํ ๊ฐ์ ํํํ๋ ๋ฐฉ์์ ๋๋ค. ์ด๋ ํ๋ จ๋ ๋ชจ๋ธ์ ์ ํ์ฑ์ ์ต๋ํ ์ ์งํ๋ฉด์๋ ์ฑ๋ฅ์ ๊ฐ์ ํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
Quantization(์์ํ)์ ํ์์ฑ
๋ฅ๋ฌ๋์์ Quantization(์์ํ)๊ฐ ํ์ํ ์ด์ ์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.
- ๋ฉ๋ชจ๋ฆฌ ์ ๊ฐ: ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ์ ํฌ๊ธฐ๋ฅผ ์ค์ฌ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ ๊ฐํฉ๋๋ค.
- ์ฐ์ฐ ์๋ ํฅ์: ๊ณ ์ ์์์ ์ฐ์ฐ์ ๋ถ๋ ์์์ ์ฐ์ฐ๋ณด๋ค ๋น ๋ฅด๊ธฐ ๋๋ฌธ์ ์ถ๋ก ์๋๊ฐ ๋นจ๋ผ์ง๋๋ค.
- ์๋์ง ํจ์จ์ฑ: ๋ฎ์ ๋นํธ ํญ(bit-width)์ผ๋ก ์ฐ์ฐํ๋ฉด ์๋์ง ์๋น๊ฐ ์ค์ด๋ญ๋๋ค.
- ๋ฐฐํฌ ์ฉ์ด์ฑ: ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ ์์์ ธ ๋ชจ๋ฐ์ผ ๊ธฐ๊ธฐ๋ ์๋ฒ ๋๋ ์์คํ ๋ฑ ์์์ด ์ ํ๋ ํ๊ฒฝ์ ๋ฐฐํฌํ๊ธฐ ์ฉ์ดํฉ๋๋ค.
Quantization(์์ํ)์ ์ข ๋ฅ
Quantization(์์ํ)์ ์ข ๋ฅ๋ ํฌ๊ฒ 3๊ฐ์ง๊ฐ ์์ต๋๋ค. ํ๋ฒ ์์ธํ ์ค๋ช ํด ๋ณด๊ฒ ์ต๋๋ค.
- ์ ์ ์์ํ (Static Quantization)
- ๋์ ์์ํ (Dynamic Quantization)
- ํ๋ จ ์ค ์์ํ (Quantization-aware Training, QAT)
์ ์ ์์ํ (Static Quantization)
์ ์ ์์ํ๋ ๋ชจ๋ธ ํ๋ จ์ด ์๋ฃ๋ ํ์ ๊ฐ์ค์น์ ํ์ฑํ ๊ฐ์ ๋ฎ์ ์ ๋ฐ๋์ ํ์(์: 8๋นํธ ์ ์)์ผ๋ก ๋ณํํ๋ ๊ธฐ๋ฒ์ ๋๋ค.
- ๊ฐ์ค์น ์์ํ: ๋ถ๋ ์์์ ๊ฐ์ค์น๋ฅผ ์ ์๋ก ๋ณํํฉ๋๋ค.
- ํ์ฑํ ๊ฐ ์์ํ: ์ถ๋ก ์ ํ์ฑํ ๊ฐ์ ์ ์๋ก ๋ณํํฉ๋๋ค.
- ์นผ๋ฆฌ๋ธ๋ ์ด์ ํ์: ํ์ฑํ ๊ฐ์ ๋ฒ์๋ฅผ ๊ฒฐ์ ํ๊ธฐ ์ํด ์ถ๊ฐ์ ์ธ ๋ฐ์ดํฐ์ ์ผ๋ก ์นผ๋ฆฌ๋ธ๋ ์ด์ ์ ์ํํฉ๋๋ค.
์ฃผ์ ํน์ง
- ์ถ๊ฐ ํ๋ จ ๋ถํ์: ์ด๋ฏธ ํ๋ จ๋ ๋ชจ๋ธ์ ์ฝ๊ฒ ์ ์ฉํ ์ ์์ผ๋ฉฐ, ์ถ๊ฐ ํ๋ จ์ด ํ์ํ์ง ์์ต๋๋ค.
- ์์ ์ ์ธ ์ฑ๋ฅ ์ ์ง: ๋ฏธ์ธ ์กฐ์ ์์ด๋ ๋ชจ๋ธ์ ์ ํ๋๋ฅผ ํฌ๊ฒ ์ ํ์ํค์ง ์์ต๋๋ค.
- ํ๋์จ์ด ์นํ์ : ์ ์ ์์ํ๋ ๋ชจ๋ธ์ ๋ค์ํ ํ๋์จ์ด์์ ํจ์จ์ ์ผ๋ก ์คํ๋ ์ ์์ต๋๋ค.
๋์ ์์ํ (Dynamic Quantization)
๋์ ์์ํ๋ ์ถ๋ก ์์ ์์ ๋ชจ๋ธ์ ์ผ๋ถ ๋๋ ์ ์ฒด ๊ฐ์ค์น์ ํ์ฑํ ๊ฐ์ ๋ฎ์ ์ ๋ฐ๋์ ํ์์ผ๋ก ๋ณํํ๋ ๊ธฐ๋ฒ์ ๋๋ค.
- ์ค์๊ฐ ์์ํ: ๋ฐํ์ ๋์ ์ค์๊ฐ์ผ๋ก ์์ํ๋ฅผ ์ํํฉ๋๋ค.
- ๋ถ๋ถ ์์ํ: ์ฃผ๋ก ๊ฐ์ค์น๋ ๋ถ๋ ์์์ ์ผ๋ก ์ ์งํ๊ณ , ํ์ฑํ ๊ฐ๋ง ์์ํํฉ๋๋ค.
- ์ ์ฉ ์ฉ์ด์ฑ: ์ฝ๋ ์์ ์์ด ๊ธฐ์กด ๋ชจ๋ธ์ ์ ์ฉํ ์ ์์ต๋๋ค.
์ฃผ์ ํน์ง
- ๋ฉ๋ชจ๋ฆฌ ํจ์จ์ฑ ํฅ์: ํ์ฑํ ๊ฐ์ ์์ํํ์ฌ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ค์ ๋๋ค.
- ์ถ๋ก ์๊ฐ ๋จ์ถ: ๊ณ ์ ์์์ ์ฐ์ฐ์ ์ฌ์ฉํ์ฌ ์ถ๋ก ์๊ฐ์ ๋จ์ถํฉ๋๋ค.
- ๋ชจ๋ธ ์ฑ๋ฅ ์ ์ง: ๋ชจ๋ธ์ ์ฑ๋ฅ ์ ํ๋ฅผ ์ต์ํํ๋ฉด์๋ ํจ์จ์ฑ์ ๊ทน๋ํํฉ๋๋ค.
ํ๋ จ ์ค ์์ํ (Quantization-aware Training, QAT)
ํ๋ จ ์ค ์์ํ(QAT)๋ ๋ชจ๋ธ ํ๋ จ ๊ณผ์ ์์ ์์ํ๋ฅผ ๊ณ ๋ คํ์ฌ ๋ชจ๋ธ์ ์ต์ ํํ๋ ๊ธฐ๋ฒ์ ๋๋ค.
- ์์ํ ์๋ฎฌ๋ ์ด์ : ํ๋ จ ์ ๊ฐ์ค์น์ ํ์ฑํ ๊ฐ์ ์์ํ๋ ์ํ๋ก ์๋ฎฌ๋ ์ด์ ํฉ๋๋ค.
- ์์ค ์ต์ํ: ์์ํ๋ก ์ธํ ์ ํ๋ ์์ค์ ํ๋ จ ๋จ๊ณ์์ ๋ณด์ ํฉ๋๋ค.
- ๋์ ์ ํ๋ ์ ์ง: ์์ํ ํ์๋ ์๋ ๋ชจ๋ธ์ ๊ฐ๊น์ด ์ ํ๋๋ฅผ ์ ์งํฉ๋๋ค.
์ฃผ์ ํน์ง
- ๋ชจ๋ธ ์ ์๋ ฅ ํฅ์: ๋ชจ๋ธ์ด ์์ํ๋ ํ๊ฒฝ์์ ๋ ์ ์๋ํ๋๋ก ํ๋ จ๋ฉ๋๋ค.
- ๋ง์ถคํ ์์ํ ์ ๋ต: ํน์ ๋ ์ด์ด๋ ์ฐ์ฐ์ ๋ํด ๋ค๋ฅธ ์์ํ ๋ฐฉ์์ ์ ์ฉํ ์ ์์ต๋๋ค.
- ๋ณต์ก์ฑ ์ฆ๊ฐ: ํ๋ จ ๊ณผ์ ์ด ๋ณต์กํด์ง๋ฉฐ, ๋ ๋ง์ ๊ณ์ฐ ์์์ด ํ์ํ ์ ์์ต๋๋ค.
Quantization(์์ํ)์ ๊ธฐ์ ์ ์ธ๋ถ ์ฌํญ
์์ํ ๊ณผ์
์ค์ผ์ผ๋ง ์ธ์ ๊ณ์ฐ
- ๋ถ๋ ์์์ ๊ฐ์ ๋ฒ์๋ฅผ ์ ์ ๊ฐ์ ๋ฒ์๋ก ๋งคํํ๊ธฐ ์ํ ์ค์ผ์ผ๋ง ์ธ์๋ฅผ ๊ณ์ฐํฉ๋๋ค.
- ์ผ๋ฐ์ ์ผ๋ก ์ต์๊ฐ๊ณผ ์ต๋๊ฐ์ ์ด์ฉํ์ฌ ์ค์ผ์ผ์ ๊ฒฐ์ ํฉ๋๋ค.
์ ๋ก ํฌ์ธํธ(Zero Point) ๊ฒฐ์
- ์ ์ ํํ์์ 0์ ํด๋นํ๋ ๋ถ๋ ์์์ ๊ฐ์ ์ ์ํฉ๋๋ค.
- ๋ถํธ ์๋ ์ ์ ํํ์ ์ง์ํ๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค.
์์ํ ๋ฐ ์ญ์์ํ
- ์์ํ: ๋ถ๋ ์์์ ๊ฐ์ ์ ์ ๊ฐ์ผ๋ก ๋ณํํฉ๋๋ค
- ์ญ์์ํ: ์ ์ ๊ฐ์ ๋ถ๋ ์์์ ๊ฐ์ผ๋ก ๋ณต์ํฉ๋๋ค.
๋นํธ ํญ(Bit-width)
- 8๋นํธ ์์ํ: ๊ฐ์ฅ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ฉฐ, ์ฑ๋ฅ๊ณผ ํจ์จ์ฑ์ ๊ท ํ์ด ์ข์ต๋๋ค.
- ์ ๋นํธ ์์ํ: 4๋นํธ, 2๋นํธ ๋ฑ ๋ ๋ฎ์ ๋นํธ ํญ์ ์ฌ์ฉํ์ฌ ๋ฉ๋ชจ๋ฆฌ์ ๊ณ์ฐ๋์ ๋์ฑ ์ค์ผ ์ ์์ง๋ง, ์ ํ๋ ์์ค์ด ๋ฐ์ํ ์ ์์ต๋๋ค.
Quantization(์์ํ) ์ ์ฉ์ ๊ณ ๋ ค์ฌํญ
์ฐ๋ฆฌ๊ฐ Deep Learning ๋ชจ๋ธ์ Quantization(์์ํ)๋ฅผ ์ ์ฉํ ๋, ๊ณ ๋ คํด์ผ ํ ์ฌํญ๋ค์ด ์์ต๋๋ค.
๋ชจ๋ธ ๊ตฌ์กฐ
- ์ผ๋ถ ๋ ์ด์ด๋ ์ฐ์ฐ์ ์์ํ์ ๋ฏผ๊ฐํ ์ ์์ผ๋ฏ๋ก, ์ ํ์ ์ผ๋ก ์์ํ๋ฅผ ์ ์ฉํฉ๋๋ค.
- ์๋ฅผ ๋ค์ด, ์ฒซ ๋ฒ์งธ ๋ฐ ๋ง์ง๋ง ๋ ์ด์ด๋ ์์ํ๋ฅผ ํผํ๋ ๊ฒ์ด ์ข์ ์ ์์ต๋๋ค.
๋ฐ์ดํฐ ๋ถํฌ
- ํ์ฑํ ๊ฐ์ ๋ถํฌ๊ฐ ๋น๋์นญ์ ์ด๊ฑฐ๋ ์ด์์น๊ฐ ๋ง์ ๊ฒฝ์ฐ, ์์ํ๋ก ์ธํ ์์ค์ด ์ปค์ง ์ ์์ต๋๋ค.
- ์ด๋ฅผ ์ํํ๊ธฐ ์ํด ํด๋ฆฌํ(clipping) ๋๋ ๋น๋์นญ ์์ํ๋ฅผ ์ฌ์ฉํ ์ ์์ต๋๋ค.
ํ๋์จ์ด ์ง์
- ์์ํ๋ ๋ชจ๋ธ์ ํจ์จ์ ์ผ๋ก ์คํํ๊ธฐ ์ํด์๋ ํด๋น ํ๋์จ์ด๊ฐ ๊ณ ์ ์์์ ์ฐ์ฐ์ ์ง์ํด์ผ ํฉ๋๋ค.
- ๋ํ์ ์ธ ์๋ก, ARM์ NEON ๋๋ NVIDIA์ TensorRT ๋ฑ์ด ์์ต๋๋ค.
LoRA & QLoRA
์ด๋ฒ์๋ LoRA & QLoRA์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.
LoRA?
LoRA๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ (fine-tuning)์ ํจ์จ์ ์ผ๋ก ์ํํ๊ธฐ ์ํ ๊ธฐ๋ฒ์ผ๋ก, ์ ์ฐจ์(low-rank) ํ๋ ฌ ๋ถํด๋ฅผ ํ์ฉํ์ฌ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ ์ ๋ฐ์ดํธ๋ฅผ ์ต์ ํํฉ๋๋ค. ๊ธฐ์กด ๋ชจ๋ธ์ ๋ชจ๋ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ๋ฐ์ดํธํ๋ ๋์ , LoRA๋ ์ ์ฐจ์ ํ๋ ฌ๋ง์ ํ์ตํ์ฌ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ค์ด๊ณ ๊ณ์ฐ ํจ์จ์ฑ์ ๋์ ๋๋ค.
LoRA์ ์๋ฆฌ
ํ๋ผ๋ฏธํฐ ํ๋ ฌ ๋ถํด
- ์๋์ ํ๋ผ๋ฏธํฐ ํ๋ ฌ W๋ฅผ ๋ ๊ฐ์ ์ ์ฐจ์ ํ๋ ฌ A์ B์ ๊ณฑ์ผ๋ก ๋ถํดํฉ๋๋ค.
- ์ฆ, W = W0 + ΔW = W0 ์ด๋ฉฐ, ์ฌ๊ธฐ์ ΔW = AB์ ๋๋ค.
- W0๋ ์ฌ์ ํ๋ จ๋ ๊ธฐ๋ณธ ํ๋ผ๋ฏธํฐ์ด๋ฉฐ, ๋ฏธ์ธ ์กฐ์ ์์๋ ΔW๋ง ์ ๋ฐ์ดํธํฉ๋๋ค.
์ ์ฐจ์ ํ๋ ฌ ์ ๋ฐ์ดํธ
- ํ์ต ์ค์๋ ์ ์ฐจ์ ํ๋ ฌ A์ B๋ง ํ์ตํ๊ณ , ๊ธฐ์กด ํ๋ผ๋ฏธํฐ W0๋ ๊ณ ์ ํฉ๋๋ค.
- ์ ์ฐจ์ ํ๋ ฌ์ ํฌ๊ธฐ๊ฐ ์๊ธฐ ๋๋ฌธ์ ํ์ตํด์ผ ํ ํ๋ผ๋ฏธํฐ ์๊ฐ ํฌ๊ฒ ๊ฐ์ํฉ๋๋ค.
ํจ์จ์ ์ธ ๋ฏธ์ธ ์กฐ์
- ์ ์ฐจ์ ํ๋ ฌ๋ง ์ ๋ฐ์ดํธํ๋ฏ๋ก ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ด ์ค์ด๋ค๊ณ , ๊ณ์ฐ ๋น์ฉ์ด ๊ฐ์ํฉ๋๋ค.
- ๋ชจ๋ธ์ ํํ๋ ฅ์ ์ ์งํ๋ฉด์๋ ์์ ํจ์จ์ ์ธ ํ์ต์ด ๊ฐ๋ฅํฉ๋๋ค.
LoRA์ ์ฅ์
๋ฉ๋ชจ๋ฆฌ ํจ์จ์ฑ ์ฆ๊ฐ
- ์ ์ฐจ์ ํ๋ ฌ๋ง ํ์ตํ๋ฏ๋ก ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ด ํฌ๊ฒ ๊ฐ์ํฉ๋๋ค.
- ์ ์ฒด ํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ฅํ๊ฑฐ๋ ์ ๋ฐ์ดํธํ ํ์๊ฐ ์์ต๋๋ค.
ํ์ต ์๋ ํฅ์
- ํ์ตํด์ผ ํ ํ๋ผ๋ฏธํฐ ์๊ฐ ์ค์ด๋ค์ด ์ฐ์ฐ๋์ด ๊ฐ์ํฉ๋๋ค.
- ์ด์ ๋ฐ๋ผ ํ์ต ์๊ฐ์ด ๋จ์ถ๋ฉ๋๋ค.
์์ ์ ํ ํ๊ฒฝ์์ ํจ๊ณผ์
- ๋ฉ๋ชจ๋ฆฌ์ ๊ณ์ฐ ์์์ด ์ ํ๋ ํ๊ฒฝ์์๋ ๋๊ท๋ชจ ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ์ด ๊ฐ๋ฅํฉ๋๋ค.
- ๋ชจ๋ฐ์ผ ๊ธฐ๊ธฐ๋ ์๋ฒ ๋๋ ์์คํ ๋ฑ์ ์ ํฉํฉ๋๋ค.
๋ชจ๋ธ ์ฑ๋ฅ ์ ์ง
- ๋ชจ๋ธ์ ํํ๋ ฅ์ ์ ์งํ๋ฉด์๋ ํจ์จ์ ์ธ ํ์ต์ด ๊ฐ๋ฅํฉ๋๋ค.
- ๋ฏธ์ธ ์กฐ์ ํ์๋ ์๋ ๋ชจ๋ธ์ ๊ฐ๊น์ด ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค.
LoRA์ ๋จ์ ๋ฐ ๊ณ ๋ ค์ฌํญ
๋ชจ๋ธ ๊ตฌ์กฐ์ ๋ณต์ก์ฑ ์ฆ๊ฐ
- ์ ์ฐจ์ ํ๋ ฌ์ ์ถ๊ฐํจ์ผ๋ก์จ ๋ชจ๋ธ์ ๊ตฌ์กฐ๊ฐ ๋ณต์กํด์ง ์ ์์ต๋๋ค.
- ๊ตฌํ ๋ฐ ์ ์ง๋ณด์๊ฐ ์ด๋ ค์์ง ์ ์์ต๋๋ค.
๋ญํฌ ์ ํ์ ์ค์์ฑ
- ์ ์ฐจ์ ํ๋ ฌ์ ๋ญํฌ r์ ์ ์ ํ๊ฒ ์ ํํด์ผ ํฉ๋๋ค.
- ๋ญํฌ๊ฐ ๋๋ฌด ๋ฎ์ผ๋ฉด ๋ชจ๋ธ์ ํํ๋ ฅ์ด ๋ถ์กฑํด์ง๊ณ , ๋๋ฌด ๋์ผ๋ฉด ๋ฉ๋ชจ๋ฆฌ ์ ๊ฐ ํจ๊ณผ๊ฐ ๊ฐ์ํฉ๋๋ค.
ํน์ ์์ ์ ๋ํ ํ๊ณ
- ๋ณต์กํ ํจํด์ด๋ ๋น์ ํ์ ์ธ ๊ด๊ณ๋ฅผ ํ์ตํด์ผ ํ๋ ์์ ์์๋ ์ ์ฐจ์ ๊ทผ์ฌ๊ฐ ์ถฉ๋ถํ์ง ์์ ์ ์์ต๋๋ค.
- ์ด๋ก ์ธํด ์ฑ๋ฅ ์ ํ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค.
์ถ๊ฐ ๋ฉ๋ชจ๋ฆฌ ์๊ตฌ
- ์ ์ฐจ์ ํ๋ ฌ์ ์ ์ฅํ๊ธฐ ์ํ ์ถ๊ฐ ๋ฉ๋ชจ๋ฆฌ๊ฐ ํ์ํฉ๋๋ค.
- ๊ทธ๋ฌ๋ ์ด๋ ์ ์ฒด ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ์ ๋นํด ๋งค์ฐ ์์ต๋๋ค.
QLoRA?
QLoRA๋ LoRA(Low-Rank Adaptation)์ ๊ฐ๋ ์ ํ์ฅํ์ฌ ์์ํ๋ ๋ชจ๋ธ์ ์ ์ฐจ์ ์ ์์ ์ ์ฉํ ๊ธฐ๋ฒ์ ๋๋ค.
์์ํ(Quantization)๋ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๋ฎ์ ๋นํธ ์ ๋ฐ๋(์: 8๋นํธ ์ ์)๋ก ๋ณํํ์ฌ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋๊ณผ ๊ณ์ฐ ํจ์จ์ฑ์ ๊ทน๋ํํ๋ ๊ธฐ์ ์ ๋๋ค.
QLoRA๋ ์์ํ์ ์ ์ฐจ์ ํ๋ ฌ ๋ถํด๋ฅผ ๊ฒฐํฉํ์ฌ ๋์ฑ ๋์ ๋ฉ๋ชจ๋ฆฌ ํจ์จ์ฑ๊ณผ ๋น ๋ฅธ ํ์ต ์๋๋ฅผ ๊ตฌํํ๋ฉด์๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ ์งํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
QLoRA์ ์๋ฆฌ
๋ชจ๋ธ ํ๋ผ๋ฏธํฐ ์์ํ
- ์์ํ๋ฅผ ํตํด ๋ชจ๋ธ์ ์ ์ฒด ํ๋ผ๋ฏธํฐ๋ฅผ ๋ฎ์ ๋นํธ ์ ๋ฐ๋๋ก ๋ณํํฉ๋๋ค.
- ์ผ๋ฐ์ ์ผ๋ก 32๋นํธ ๋ถ๋ ์์์ ๊ฐ์ 8๋นํธ ์ ์๋ก ๋ณํํ์ฌ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ํฌ๊ฒ ์ค์ ๋๋ค.
- ์์ํ๋ ์ฐ์ฐ์ ๋จ์ํํ์ฌ ๊ณ์ฐ ์๋๋ฅผ ํฅ์์ํต๋๋ค.
์ ์ฐจ์ ํ๋ ฌ ๋ถํด
- ์์ํ๋ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ฐจ์ ํ๋ ฌ๋ก ๋ถํดํฉ๋๋ค.
- ๊ณ ์ฐจ์ ํ๋ผ๋ฏธํฐ ํ๋ ฌ์ ๋ ๊ฐ์ ์์ ์ ์ฐจ์ ํ๋ ฌ์ ๊ณฑ์ผ๋ก ๊ทผ์ฌํํฉ๋๋ค.
- ์ ์ฐจ์ ๊ทผ์ฌ๋ ์๋ ํ๋ผ๋ฏธํฐ์ ์ค์ํ ํน์ง์ ํฌ์ฐฉํ๋ฉด์๋ ์์ ์ฌ์ฉ์ ์ค์ ๋๋ค.
LoRA ๋ฐฉ์์ผ๋ก ํ์ต ์งํ
- LoRA ๊ธฐ๋ฒ์ ํ์ฉํ์ฌ ์ ์ฐจ์ ํ๋ ฌ๋ง์ ํ์ตํฉ๋๋ค.
- ์์ํ๋ ๊ธฐ๋ณธ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๋ ๊ณ ์ ์ํค๊ณ , ์ ์ฐจ์ ํ๋ ฌ๋ง ์ ๋ฐ์ดํธํฉ๋๋ค.
- ์ด๋ฅผ ํตํด ํ์ตํด์ผ ํ ํ๋ผ๋ฏธํฐ ์๊ฐ ๊ฐ์ํ์ฌ ํ์ต ์๋๊ฐ ๋นจ๋ผ์ง๋๋ค.
์์ํ์ ์ ์ฐจ์ ์ ์์ ๊ฒฐํฉ
- ์์ํ๋ก ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋๊ณผ ๊ณ์ฐ ๋น์ฉ์ ์ค์ด๊ณ , ์ ์ฐจ์ ์ ์์ผ๋ก ํจ์จ์ ์ธ ๋ฏธ์ธ ์กฐ์ ์ ์ํํฉ๋๋ค.
- ๋ ๊ฐ์ง ๊ธฐ๋ฒ์ ์ฅ์ ์ ๊ฒฐํฉํ์ฌ ๋ชจ๋ธ์ ํจ์จ์ฑ์ ๊ทน๋ํํฉ๋๋ค.
QLoRA์ ์ฅ์
๋ฉ๋ชจ๋ฆฌ ํจ์จ์ฑ
- ์์ํ์ ์ ์ฐจ์ ๋ถํด๋ฅผ ํตํด ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ต์ํํฉ๋๋ค.
- ๋ฎ์ ๋นํธ ์ ๋ฐ๋์ ํ๋ผ๋ฏธํฐ์ ์์ ํฌ๊ธฐ์ ์ ์ฐจ์ ํ๋ ฌ๋ง ์ ์ฅํ๋ฉด ๋ฉ๋๋ค.
๋น ๋ฅธ ํ์ต ์๋
- ํ์ตํด์ผ ํ ํ๋ผ๋ฏธํฐ ์๊ฐ ํฌ๊ฒ ๊ฐ์ํ์ฌ ์ฐ์ฐ๋์ด ์ค์ด๋ญ๋๋ค.
- ๊ณ์ฐ์ด ๊ฐ์ํ๋์ด ํ์ต ๋ฐ ์ถ๋ก ์๋๊ฐ ๋นจ๋ผ์ง๋๋ค.
์ฑ๋ฅ ์ ์ง
- ํ๋ผ๋ฏธํฐ์ ๊ฐ์์ ์ ๋ฐ๋ ํ๋ฝ์๋ ๋ถ๊ตฌํ๊ณ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ฑฐ์ ์ ์งํ ์ ์์ต๋๋ค.
- ์ ์ฐจ์ ์ ์์ด ์ค์ํ ์ ๋ณด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ์ตํฉ๋๋ค.
์์ ํจ์จ์ฑ
- ์ ํ๋ ์ปดํจํ ์์ ํ๊ฒฝ์์๋ ๋๊ท๋ชจ ๋ชจ๋ธ์ ํจ๊ณผ์ ์ผ๋ก ๋ฏธ์ธ ์กฐ์ ํ๊ณ ๋ฐฐํฌํ ์ ์์ต๋๋ค.
QLoRA์ ๋จ์
QLoRA๋ ์์ํ์ LoRA์ ๋จ์ ์ ๋ชจ๋ ํฌํจํ๋ฉฐ, ์ถ๊ฐ์ ์ธ ์ด๋ ค์๋ ์กด์ฌํฉ๋๋ค.
์์ํ ์ค๋ฅ ๋ฐ์ ๊ฐ๋ฅ์ฑ
- ํ๋ผ๋ฏธํฐ ์ ๋ฐ๋๋ฅผ ๋ฎ์ถ๋ ๊ณผ์ ์์ ์์ํ ์ค๋ฅ๋ ์ก์์ด ๋ฐ์ํ ์ ์์ต๋๋ค.
- ๋ฏผ๊ฐํ ๋ชจ๋ธ์ ๊ฒฝ์ฐ ์ ํ๋๊ฐ ํฌ๊ฒ ๋จ์ด์ง ์ ์์ต๋๋ค.
๊ตฌํ ๋ณต์ก์ฑ ์ฆ๊ฐ
- ์์ํ์ ์ ์ฐจ์ ๋ถํด๋ฅผ ๊ฒฐํฉํ์ฌ ๊ตฌํ ๋ณต์ก๋๊ฐ ๋์์ง๋๋ค.
- ๊ฐ๋ฐ ์๊ฐ๊ณผ ๋น์ฉ์ด ์ฆ๊ฐํ ์ ์์ต๋๋ค.
ํ๋์จ์ด ์์กด์ฑ
- ์์ํ๋ ๋ชจ๋ธ์ ํจ์จ์ ์ธ ์คํ์ ์ํด ํน์ ํ๋์จ์ด(์: 8๋นํธ ์ฐ์ฐ์ ์ง์ํ๋ GPU๋ TPU)๊ฐ ํ์ํ ์ ์์ต๋๋ค.
- ์ด๋ ๋ชจ๋ธ์ ์ด์์ฑ์ ์ ํํฉ๋๋ค.
์ถ๊ฐ ๊ณ์ฐ ์ค๋ฒํค๋
- ์์ํ์ ์ ์ฐจ์ ๋ถํด ๊ณผ์ ์์ ์ถ๊ฐ์ ์ธ ๊ณ์ฐ์ด ํ์ํฉ๋๋ค.
- ์ด๋ ์ผ๋ถ ๊ฒฝ์ฐ์ ์ ์ฒด ํจ์จ์ฑ ์ด๋์ ์์ํ ์ ์์ต๋๋ค.
ํ์ต ์์ ์ฑ ๋ฌธ์
- ์์ํ๋ก ์ธํด ์ต์ ํ ๊ณผ์ ์ด ๋ถ์์ ํด์ง ์ ์์ต๋๋ค.
- ํ์ต์ด ์๋ ดํ์ง ์๊ฑฐ๋ ์ฑ๋ฅ์ด ๋ค์ญ๋ ์ญํ ์ํ์ด ์์ต๋๋ค.
ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋์ ๋ณต์ก์ฑ
- ์ ์ ํ ํ๋ ฌ์ ๋ญํฌ(rank)์ ์์ํ ์์ค์ ์ฐพ๊ธฐ ์ํด ๋ง์ ์คํ์ด ํ์ํ ์ ์์ต๋๋ค.
'๐ฅ๏ธ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[DL] Model Distillation (๋ชจ๋ธ ์ฆ๋ฅ) (0) | 2024.09.18 |
---|---|
[DL] Finetuning (ํ์ธํ๋) (0) | 2024.09.18 |
[DL] Deep Learning Model Optimization (๋ฅ๋ฌ๋ ๋ชจ๋ธ ์ต์ ํ) (0) | 2024.08.31 |
[DL] Transfer Learning - ์ ์ด ํ์ต (0) | 2024.05.19 |
[DL] ๋ํ์ ์ธ CNN Network - LeNet 5, AlexNet, ZFNet, VGGNet, GoogLeNet, ResNet (0) | 2024.05.16 |