A A
[ML] Supervised Learning (์ง€๋„ํ•™์Šต)
์ด๋ฒˆ์—๋Š” Supervised Learning (์ง€๋„ํ•™์Šต)์— ๋ฐํ•˜์—ฌ ํ•œ๋ฒˆ ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

 

Supervised Learning (์ง€๋„ํ•™์Šต) ์ด๋ž€?

์ง€๋„ํ•™์Šต์€ Machine Learning(๊ธฐ๊ณ„ํ•™์Šต)์˜ ํ•œ ๋ถ„์•ผ๋กœ, ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์™€ ๊ทธ์— ๋Œ€์‘ํ•˜๋Š” ์ •๋‹ต(๋ ˆ์ด๋ธ”)์„ ํ•จ๊ป˜ ์ œ๊ณต๋ฐ›์•„ ํ•™์Šตํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์„ ํ†ตํ•ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์ƒˆ๋กœ์šด ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์ •ํ™•ํ•œ ์ถœ๋ ฅ์„ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค.

 

์ฃผ์š”ํ•œ ํŠน์ง•๋“ค์— ๋ฐํ•˜์—ฌ ๋” ์‚ดํŽด๋ณด๋ฉด

 

1. ๋ ˆ์ด๋ธ”์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ ์‚ฌ์šฉ 

  • ๊ฐ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ์—๋Š” ์ž…๋ ฅ๊ฐ’๊ณผ ๊ทธ์— ๋Œ€์‘ํ•˜๋Š” ์ •๋‹ต์ด ํ•จ๊ป˜ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค.
  • ์˜ˆ๋ฅผ ๋“ค์–ด, ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์ž‘์—…์—์„œ๋Š” ์ด๋ฏธ์ง€(์ž…๋ ฅ)์™€ ๊ทธ ์ด๋ฏธ์ง€๊ฐ€ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ์ฒด์˜ ์ด๋ฆ„(์ถœ๋ ฅ)์ด ์Œ์„ ์ด๋ฃน๋‹ˆ๋‹ค.
  • ์‚ฌ์ง„๊ณผ ๊ทธ ์‚ฌ์ง„์˜ ํƒœ๊ทธ(์˜ˆ: "๊ฐ•์•„์ง€", "๊ณ ์–‘์ด")๊ฐ€ ์Œ์œผ๋กœ ์ฃผ์–ด์ง€๋ฉด, ๋ชจ๋ธ์€ ์ด ์ •๋ณด๋ฅผ ํ•™์Šตํ•˜์—ฌ ์ƒˆ๋กœ์šด ์‚ฌ์ง„์˜ ํƒœ๊ทธ๋ฅผ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2. ์˜ˆ์ธก ๋ชจ๋ธ ํ•™์Šต

  • ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์ž…๋ ฅ๊ณผ ์ถœ๋ ฅ ์‚ฌ์ด์˜ ๊ด€๊ณ„๋ฅผ ํ•™์Šตํ•˜์—ฌ ํ•จ์ˆ˜๋ฅผ ๊ทผ์‚ฌํ™”ํ•ฉ๋‹ˆ๋‹ค.
  • ์ด ํ•จ์ˆ˜๋Š” ์ƒˆ๋กœ์šด ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์ถœ๋ ฅ์„ ์˜ˆ์ธกํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

3. ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ํ–ฅ์ƒ 

  • ๋ชจ๋ธ์˜ ๊ถ๊ทน์ ์ธ ๋ชฉํ‘œ๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ฒ˜์Œ ๋ณด๋Š” ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ๋„ ์ •ํ™•ํ•œ ์˜ˆ์ธก์„ ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
  • ์ด๋ฅผ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ๊ธฐ๋ฒ•๋“ค(์ •๊ทœํ™”, ๊ต์ฐจ ๊ฒ€์ฆ ๋“ฑ)์ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
  • ๋˜ํ•œ ๋ชจ๋ธ์ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์—์„œ๋„ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•˜๋„๋ก ํ•˜๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ์ž…๋‹ˆ๋‹ค.

Supervised Learning (์ง€๋„ํ•™์Šต)์˜ ์ฃผ์š” ๋ถ„๋ฅ˜

๊ทธ๋Ÿฌ๋ฉด ์ง€๋„ ํ•™์Šต์—” ์ฃผ๋กœ ์–ด๋– ํ•œ ๋ถ„๋ฅ˜ ๊ณผ์ •์ด ์žˆ์„๊นŒ์š”? ํฌ๊ฒŒ ํšŒ๊ท€ (Regression), ๋ถ„๋ฅ˜ (Classification)์ด ์žˆ์Šต๋‹ˆ๋‹ค.

1. ํšŒ๊ท€ (Regression)

  • ์—ฐ์†์ ์ธ ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
  • ์˜ˆ๋ฅผ ๋“ค์–ด, ์ฃผํƒ์˜ ํŠน์„ฑ(๋ฉด์ , ๋ฐฉ์˜ ๊ฐœ์ˆ˜ ๋“ฑ)์„ ๋ฐ”ํƒ•์œผ๋กœ ์ฃผํƒ ๊ฐ€๊ฒฉ์„ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ์ด ํšŒ๊ท€ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค.
  • ์ฃผ์š” ์•Œ๊ณ ๋ฆฌ์ฆ˜: ์„ ํ˜• ํšŒ๊ท€, ๋‹คํ•ญ ํšŒ๊ท€, ๊ฒฐ์ • ํŠธ๋ฆฌ ํšŒ๊ท€, ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ ํšŒ๊ท€ ๋“ฑ

 

2. ๋ถ„๋ฅ˜ (Classification)

  • ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฏธ๋ฆฌ ์ •์˜๋œ ๋ฒ”์ฃผ ์ค‘ ํ•˜๋‚˜๋กœ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
  • ์˜ˆ๋ฅผ ๋“ค์–ด, ์ด๋ฉ”์ผ์ด ์ŠคํŒธ์ธ์ง€ ์•„๋‹Œ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฌธ์ œ๊ฐ€ ๋ถ„๋ฅ˜ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค.
  • ์ฃผ์š” ์•Œ๊ณ ๋ฆฌ์ฆ˜: ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€, ๊ฒฐ์ • ํŠธ๋ฆฌ, ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ, ์„œํฌํŠธ ๋ฒกํ„ฐ ๋จธ์‹ (SVM), ๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ ๋“ฑ

Supervised Learning (์ง€๋„ํ•™์Šต)์˜ ์ฃผ์š” ๊ฐœ๋…

3๊ฐ€์ง€์˜ ๊ธฐ๋ณธ ๊ฐœ๋…์— ๋ฐํ•˜์—ฌ ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ผ๋ฐ˜ํ™”(Generalization), ๊ณผ๋Œ€์ ํ•ฉ(Overfitting), ๊ณผ์†Œ์ ํ•ฉ(Underfitting)์ž…๋‹ˆ๋‹ค.
  • ์ผ๋ฐ˜ํ™”(Generalization): ๋ชจ๋ธ์ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ํ•™์Šตํ•œ ๋‚ด์šฉ์„ ๋ฐ”ํƒ•์œผ๋กœ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ๋„ ์ž˜ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ๋งํ•ฉ๋‹ˆ๋‹ค. ์ข‹์€ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์€ ๋ชจ๋ธ์ด ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ํŒจํ„ด์„ ์ž˜ ํฌ์ฐฉํ•˜๊ณ , ์ด๋ฅผ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ์ ์šฉํ•  ์ˆ˜ ์žˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
  • ๊ณผ๋Œ€์ ํ•ฉ(Overfitting): ๋ชจ๋ธ์ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ๋„ˆ๋ฌด ์ •ํ™•ํ•˜๊ฒŒ ๋งž์ถ”๋ ค๋Š” ๊ฒฝํ–ฅ์„ ๋ณด์ด๋ฉด์„œ, ๋ฐ์ดํ„ฐ์— ํฌํ•จ๋œ ๋…ธ์ด์ฆˆ๊นŒ์ง€ ํ•™์Šตํ•˜๋Š” ํ˜„์ƒ์ž…๋‹ˆ๋‹ค. ์ด๋กœ ์ธํ•ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ๋Š” ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋ณด์ด์ง€๋งŒ, ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์—์„œ๋Š” ์„ฑ๋Šฅ์ด ์ €ํ•˜๋ฉ๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ๋ณต์žกํ•œ ๋ชจ๋ธ์—์„œ ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์€ 4๊ฐ€์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
    • a) ๊ทœ์ œ (Regularization): L1, L2 ์ •๊ทœํ™” ๋“ฑ์„ ํ†ตํ•ด ๋ชจ๋ธ์˜ ๋ณต์žก๋„๋ฅผ ์ œํ•œํ•ฉ๋‹ˆ๋‹ค.
    • b) ๊ต์ฐจ ๊ฒ€์ฆ (Cross-Validation): ๋ฐ์ดํ„ฐ๋ฅผ ์—ฌ๋Ÿฌ ๋ถ€๋ถ„์œผ๋กœ ๋‚˜๋ˆ„์–ด ๋ฐ˜๋ณต์ ์œผ๋กœ ํ•™์Šตํ•˜๊ณ  ๊ฒ€์ฆํ•ฉ๋‹ˆ๋‹ค.
    • c) ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• (Data Augmentation): ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์ธ์œ„์ ์œผ๋กœ ๋Š˜๋ ค ๋‹ค์–‘์„ฑ์„ ์ฆ๊ฐ€์‹œํ‚ต๋‹ˆ๋‹ค.
    • d) ๋“œ๋กญ์•„์›ƒ (Dropout): ์‹ ๊ฒฝ๋ง์—์„œ ์ผ๋ถ€ ๋‰ด๋Ÿฐ์„ ๋žœ๋คํ•˜๊ฒŒ ๋น„ํ™œ์„ฑํ™”ํ•˜์—ฌ ๊ณผ๋Œ€์ ํ•ฉ์„ ๋ฐฉ์ง€ํ•ฉ๋‹ˆ๋‹ค.
  • ๊ณผ์†Œ์ ํ•ฉ(Underfitting): ๋ชจ๋ธ์ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ ํŒจํ„ด์„ ์ œ๋Œ€๋กœ ํ•™์Šตํ•˜์ง€ ๋ชปํ•˜๋Š” ํ˜„์ƒ์ž…๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์™€ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ ๋ชจ๋‘์—์„œ ๋‚ฎ์€ ์ •ํ™•๋„๋ฅผ ๋ณด์ž…๋‹ˆ๋‹ค. ๋„ˆ๋ฌด ๋‹จ์ˆœํ•œ ๋ชจ๋ธ์—์„œ ์ž์ฃผ ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ํ•ด๊ฒฐ๋ฐฉ๋ฒ•์€ ์•„๋ž˜์— ์žˆ์Šต๋‹ˆ๋‹ค.
    • a) ๋ชจ๋ธ ๋ณต์žก๋„ ์ฆ๊ฐ€: ๋” ๋ณต์žกํ•œ ๋ชจ๋ธ(์˜ˆ: ๋” ๊นŠ์€ ์‹ ๊ฒฝ๋ง)์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
    • b) ํŠน์„ฑ ๊ณตํ•™: ์ƒˆ๋กœ์šด ํŠน์„ฑ์„ ์ƒ์„ฑํ•˜๊ฑฐ๋‚˜ ๊ธฐ์กด ํŠน์„ฑ์„ ๋ณ€ํ™˜ํ•˜์—ฌ ๋ชจ๋ธ์˜ ํ‘œํ˜„๋ ฅ์„ ๋†’์ž…๋‹ˆ๋‹ค.
    • c) ํ•™์Šต ์‹œ๊ฐ„ ์ฆ๊ฐ€: ๋” ์˜ค๋žœ ์‹œ๊ฐ„ ๋™์•ˆ ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค.

Supervised Learning (์ง€๋„ํ•™์Šต) Process

๊ทธ๋Ÿฌ๋ฉด Supervised Learning (์ง€๋„ํ•™์Šต)์˜ Process๋Š” ๋ฌด์—‡์ด ์žˆ์„๊นŒ์š”?
  • ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ์ „์ฒ˜๋ฆฌ
    • ๊ด€๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ณ  ์ •์ œํ•ฉ๋‹ˆ๋‹ค.
    • ๊ฒฐ์ธก์น˜ ์ฒ˜๋ฆฌ, ์ด์ƒ์น˜ ์ œ๊ฑฐ, ํŠน์„ฑ ์Šค์ผ€์ผ๋ง ๋“ฑ์˜ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ฐ์ดํ„ฐ ๋ถ„ํ• 
    • ์ผ๋ฐ˜์ ์œผ๋กœ ํ›ˆ๋ จ ์„ธํŠธ(60-80%), ๊ฒ€์ฆ ์„ธํŠธ(10-20%), ํ…Œ์ŠคํŠธ ์„ธํŠธ(10-20%)๋กœ ๋‚˜๋ˆ•๋‹ˆ๋‹ค.
    • ์ด๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์˜ ํ•™์Šต, ํŠœ๋‹, ์ตœ์ข… ํ‰๊ฐ€๋ฅผ ๋…๋ฆฝ์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋ชจ๋ธ ์„ ํƒ ๋ฐ ํ•™์Šต
    • ๋ฌธ์ œ์— ์ ํ•ฉํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค.
    • ์„ ํƒํ•œ ๋ชจ๋ธ์„ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค.
  • ๋ชจ๋ธ ํ‰๊ฐ€ ๋ฐ ํŠœ๋‹
    • ๊ฒ€์ฆ ์„ธํŠธ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
    • ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹, ํŠน์„ฑ ์„ ํƒ ๋“ฑ์„ ํ†ตํ•ด ๋ชจ๋ธ์„ ๊ฐœ์„ ํ•ฉ๋‹ˆ๋‹ค.
  • ์ตœ์ข… ํ‰๊ฐ€ ๋ฐ ๋ฐฐํฌ
    • ํ…Œ์ŠคํŠธ ์„ธํŠธ๋กœ ์ตœ์ข… ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
    • ๋งŒ์กฑ์Šค๋Ÿฌ์šด ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉด ์‹ค์ œ ํ™˜๊ฒฝ์— ๋ชจ๋ธ์„ ๋ฐฐํฌํ•ฉ๋‹ˆ๋‹ค.

์ด๋ ‡๊ฒŒ ์ง€๋„ํ•™์Šต์˜ ๊ธฐ๋ณธ ๊ฐœ๋…๊ณผ ํ”„๋กœ์„ธ์Šค, ๊ทธ๋ฆฌ๊ณ  ๊ณผ๋Œ€์ ํ•ฉ๊ณผ ๊ณผ์†Œ์ ํ•ฉ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์•˜์Šต๋‹ˆ๋‹ค.

๊ทธ๋Ÿฌ๋ฉด ๋‹ค์Œ๊ธ€์—์„  ์ง€๋„ํ•™์Šต์—๋Š” ์–ด๋– ํ•œ Machine Learning ๊ธฐ๋ฒ•์ด ์“ฐ์ด๋Š”์ง€ ํ•œ๋ฒˆ ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.