๐ Data Engineering/๐ Machine Learning
์์ ๊ธ์์ ๋น์ง๋ํ์ต์ ๊ธฐ๋ฒ๋ค์ ๋ฐํ์ฌ ์์๋ณด์์ต๋๋ค.์ด๋ฒ์๋ ๊ทธ ์ค ํ๋์ธ K-Means Clustering (K-ํ๊ท ํด๋ฌ์คํฐ๋ง)์ ๋ฐํ์ฌ ์์๋ณด๊ฒ ์ต๋๋ค. K-ํ๊ท ํด๋ฌ์คํฐ๋ง์ ๋ฐ์ดํฐ๋ฅผ K๊ฐ์ ๊ตฐ์ง์ผ๋ก ๋๋์ด ๊ฐ ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ์ ์ฌํ ํน์ฑ์ ๊ฐ์ง ๊ทธ๋ฃน์ผ๋ก ๋ฌถ๋ ๊ตฐ์งํ ์๊ณ ๋ฆฌ์ฆ์
๋๋ค.์ด๋ฅผ ํตํด ๋ฐ์ดํฐ์ ๊ตฌ์กฐ๋ฅผ ์ดํดํ๊ณ , ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ์๊ฐํ๋ฅผ ์ฉ์ดํ๊ฒ ํ ์ ์์ต๋๋ค.K-Means Clustering์ ํน์งK-ํ๊ท ํด๋ฌ์คํฐ๋ง์ ํน์ง์ ์ฌ๋ฌ๊ฐ๊ฐ ์์ต๋๋ค. ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค. 1. ๊ตฐ์ง ์ K: ์ฌ์ฉ์๊ฐ ๊ตฐ์ง ์ K๋ฅผ ์ฌ์ ์ ์ ์ํด์ผ ํ๋ฉฐ, ์ด ๊ฐ์ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ง๊ฒฐ๋๋ ์ค์ํ ํ์ดํผํ๋ผ๋ฏธํฐ์
๋๋ค.์ ์ ํ K๋ฅผ ์ ํํ๋ ๊ฒ์ด ๊ตฐ์งํ์ ์ฑ๊ณต ์ฌ๋ถ์ ํฐ ์ํฅ์ ๋ฏธ์นฉ๋๋ค. 2. ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ ์๊ณ ๋ฆฌ์ฆ: K..
๐ Data Engineering/๐ Machine Learning
์ด๋ฒ์๋ ๋น์ง๋ ํ์ต์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.๋น์ง๋ ํ์ต(Unsupervised Learning)์ ๋ ์ด๋ธ์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ๋ด์ ํจํด์ด๋ ๊ตฌ์กฐ๋ฅผ ๋ฐ๊ฒฌํ๋ ๋จธ์ ๋ฌ๋ ๋ฐฉ๋ฒ์
๋๋ค.์ด ํ์ต ๋ฐฉ์์ ๋ฐ์ดํฐ์ ์ฌ์ ์ง์ ์์ด ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ , ๊ทธ ์์ ์จ๊ฒจ์ง ์๋ฏธ ์๋ ๊ตฌ์กฐ๋ ๊ด๊ณ๋ฅผ ๋ฐ๊ฒฌํ๋ ๋ฐ ์ค์ ์ ๋ก๋๋ค.Unsupervised Learning (๋น์ง๋ ํ์ต) ์ฃผ์ ํน์ง๋ ์ด๋ธ ์์: ๋น์ง๋ ํ์ต์ ๋ ์ด๋ธ์ด๋ ๋ชฉํ ๋ณ์๊ฐ ์๋ ์
๋ ฅ ๋ฐ์ดํฐ๋ง์ ์ฌ์ฉํฉ๋๋ค. ์ด๋ ๋ ์ด๋ธ๋ง์ด ์ด๋ ต๊ฑฐ๋ ๋ถ๊ฐ๋ฅํ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์ ๋ค๋ฃฐ ๋ ์ ์ฉํฉ๋๋ค.ํจํด ๋ฐ๊ฒฌ: ๋น์ง๋ ํ์ต์ ๋ฐ์ดํฐ ๋ด์์ ์จ๊ฒจ์ง ํจํด์ด๋ ๊ตฌ์กฐ๋ฅผ ํ์ํ์ฌ ๋ฐ์ดํฐ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ดํดํ๋ ค๊ณ ํฉ๋๋ค. ์ด๋ฌํ ํจํด ๋ฐ๊ฒฌ์ ๋ฐ์ดํฐ์ ๋ณธ์ง์ ์ธ ํน์ฑ์ ์ดํดํ๋ ..
๐ Data Engineering/๐ Machine Learning
์ด๋ฒ์๋ ๋ค์ธต ํผ์
ํธ๋ก (Multilayer Perceptron, MLP)์ ๋ฐํ์ฌ ์์๋ณด๊ฒ ์ต๋๋ค. ๋ค์ธต ํผ์
ํธ๋ก (Multilayer Perceptron, MLP)๋ค์ธต ํผ์
ํธ๋ก (Multilayer Perceptron, MLP)์ ๊ธฐ๋ณธ์ ์ธ ์ธ๊ณต ์ ๊ฒฝ๋ง์ ํํ ์ค ํ๋๋ก, ํนํ ๋ณต์กํ ๋น์ ํ ๊ด๊ณ์ ํจํด์ ํ์ตํ ์ ์๋ ๋ฅ๋ ฅ์ผ๋ก ์ธํด ๋ถ๋ฅ ๋ฐ ํ๊ท ๋ฌธ์ ์ ๋๋ฆฌ ์ฌ์ฉ๋ฉ๋๋ค. ๊ธฐ๋ณธ ๊ตฌ์กฐ๋ ์
๋ ฅ์ธต, ํ๋ ์ด์์ ์๋์ธต, ๊ทธ๋ฆฌ๊ณ ์ถ๋ ฅ์ธต์ผ๋ก ์ด๋ฃจ์ด์ง FeedForward ์ ๊ฒฝ๋ง ์ด๋ฉฐ, ๊ฐ ์ธต์ ์ฌ๋ฌ ๋ด๋ฐ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.๋ํ ๊ฐ ๋ด๋ฐ์ ์ด์ ์ธต์ ๋ด๋ฐ์ผ๋ก๋ถํฐ ์
๋ ฅ์ ๋ฐ์ ๊ฐ์ค์น๋ฅผ ์ ์ฉํ๊ณ , ํ์ฑํ ํจ์๋ฅผ ํตํด ์ถ๋ ฅ์ ์์ฑํฉ๋๋ค.๋ค์ธต ํผ์
ํธ๋ก (Multilayer Perceptron, MLP)์ ๊ตฌ์กฐ๋ค์ธต ํผ์
ํธ๋ก ์ ๊ตฌ์กฐ๋ ..
๐ Data Engineering/๐ Machine Learning
์ด๋ฒ์๋ Random Forest (๋๋ค ํฌ๋ ์คํธ) ๊ธฐ๋ฒ์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค. ๋๋ค ํฌ๋ ์คํธ(Random Forest)๋ ๊ฒฐ์ ํธ๋ฆฌ์ ์์๋ธ ๋ฐฉ๋ฒ ์ค ํ๋๋ก, ์ฌ๋ฌ ๊ฐ์ ๊ฒฐ์ ํธ๋ฆฌ๋ฅผ ์์ฑํ๊ณ ๊ทธ ์์ธก์ ๊ฒฐํฉํ์ฌ ๋์ฑ ๊ฐ๋ ฅํ๊ณ ์์ ์ ์ธ ๋ชจ๋ธ์ ๋ง๋๋ ๋ฐฉ๋ฒ์
๋๋ค. ์ด ๋ฐฉ๋ฒ์ ํนํ ๋ถ๋ฅ์ ํ๊ท ๋ฌธ์ ์ ํจ๊ณผ์ ์ด๋ฉฐ, ๊ฐ๋ณ ๊ฒฐ์ ํธ๋ฆฌ์ ๊ณผ์ ํฉ ๋ฌธ์ ๋ฅผ ๊ทน๋ณตํ๊ณ , ์ ์ฒด์ ์ธ ์์ธก ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋ฐ ๋์์ ์ค๋๋ค. Random Forest (๋๋ค ํฌ๋ ์คํธ)์ ์ฃผ์ ํน์ง๋ค์์ฑ (Diversity)๋๋ค ํฌ๋ ์คํธ๋ ๊ฐ๊ฐ์ ๊ฒฐ์ ํธ๋ฆฌ๊ฐ ๋ฐ์ดํฐ์ ์๋ก ๋ค๋ฅธ ๋ถ๋ถ์งํฉ๊ณผ ํน์ฑ์ ์ฌ์ฉํ์ฌ ํ์ตํฉ๋๋ค. ์ด๋ ๊ฐ ํธ๋ฆฌ๊ฐ ๋
๋ฆฝ์ ์ผ๋ก ๋ค๋ฅธ ํจํด์ ํ์ตํ๋๋ก ํ์ฌ ๋ชจ๋ธ ์ ์ฒด์ ๋ค์์ฑ์ ๋์
๋๋ค.์ด๋ฌํ ์ ๊ทผ ๋ฐฉ์์ ํธ๋ฆฌ ๊ฐ์ ์๊ด๊ด๊ณ..
๐ Data Engineering/๐ Machine Learning
์ด๋ฒ์๋ Decision Tree (๊ฒฐ์ ํธ๋ฆฌ)์ ๋ฐํ์ฌ ์์๋ณด๊ฒ ์ต๋๋ค. ๊ฒฐ์ ํธ๋ฆฌ(Decision Tree)๋ ๋ถ๋ฅ์ ํ๊ท ๋ฌธ์ ์ ๋ชจ๋ ์ฌ์ฉ๋ ์ ์๋ ์ง๋ํ์ต ์๊ณ ๋ฆฌ์ฆ์
๋๋ค.์ด ๋ชจ๋ธ์ ๋ฐ์ดํฐ๋ฅผ ํธ๋ฆฌ ๊ตฌ์กฐ๋ก ๋ถํ ํ์ฌ ์์ธก์ ์ํํ๋ฉฐ, ๊ฐ ๋ด๋ถ ๋
ธ๋๋ ํน์ ์กฐ๊ฑด์ ๋ฐ๋ฅธ ๋ฐ์ดํฐ ๋ถํ ์ ๋ํ๋ด๊ณ , ๊ฐ์ง(branch)๋ ๊ทธ ์กฐ๊ฑด์ ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋ด๋ฉฐ, ์ต์ข
๋ฆฌํ ๋
ธ๋(leaf node)๋ ์์ธก ๊ฐ์ ์ ๊ณตํฉ๋๋ค.Decision Tree์ ์ฃผ์ ํน์ง์ง๊ด์ฑ: ๊ฒฐ์ ํธ๋ฆฌ๋ ์๊ฐ์ ์ผ๋ก ํํํ ์ ์์ด ์ดํด๊ฐ ์ฝ์ต๋๋ค.๋น๋ชจ์์ ๋ฐฉ๋ฒ: ๋ฐ์ดํฐ์ ๋ถํฌ์ ๋ํด ํน์ ๊ฐ์ ์ ํ์ง ์์ผ๋ฏ๋ก ๋ค์ํ ๋ฐ์ดํฐ์
์ ์ ์ฉ ๊ฐ๋ฅํฉ๋๋ค.ํด์ ์ฉ์ด์ฑ: ๋ชจ๋ธ์ด ์ด๋ป๊ฒ ๊ฒฐ์ ์ ๋ด๋ ธ๋์ง ์ฝ๊ฒ ํด์ํ ์ ์์ต๋๋ค.Decision Tree์ ๊ธฐ๋ณธ ์๋ฆฌ๋
ธ๋์..
๐ Data Engineering/๐ Machine Learning
์ด๋ฒ์๋ Support Vector Machine (์ํฌํธ ๋ฒกํฐ ๋จธ์ )์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค. ์ํฌํธ ๋ฒกํฐ ๋จธ์ (Support Vector Machine, SVM)์ ๋ณต์กํ ๋ฐ์ดํฐ์
์์๋ ํจ๊ณผ์ ์ธ ๋ถ๋ฅ๋ฅผ ์ํํ ์ ์๋ ๊ฐ๋ ฅํ ์ง๋ํ์ต ์๊ณ ๋ฆฌ์ฆ์
๋๋ค. ์ด ์๊ณ ๋ฆฌ์ฆ์ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฆฌํ๋ ์ต์ ์ ์ดํ๋ฉด(๊ฒฐ์ ๊ฒฝ๊ณ)์ ์ฐพ์๋ด๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.SVM์ ์ฃผ์ ํน์ง๊ณผ ์๋ฆฌ๋ฅผ ์์ธํ ์ดํด๋ณด๊ฒ ์ต๋๋ค. Support Vector Machine (SVM)์ ์ฃผ์ ํน์ง๊ฒฐ์ ์ดํ๋ฉด(Decision Hyperplane): ๋ ํด๋์ค๋ฅผ ๋ถ๋ฆฌํ๋ ๊ฐ์ฅ ์ข์ ์ดํ๋ฉด์ ์ฐพ์ต๋๋ค. ์ด ํ๋ฉด์ ๋ ํด๋์ค ๊ฐ์ ๋ง์ง(๊ฑฐ๋ฆฌ)์ ์ต๋ํํฉ๋๋ค.w: ์ดํ๋ฉด์ ๋ฒ์ ๋ฒกํฐ, x: ๋ฐ์ดํฐ ํฌ์ธํธ, b: ์ ํธw * x + b = 0์ํฌํธ ๋ฒกํฐ..
๐ Data Engineering/๐ Machine Learning
์ด๋ฒ์ Logistic Regression (๋ก์ง์คํฑ ํ๊ท)์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.Logistic Regression (๋ก์ง์คํฑ ํ๊ท)๋ก์ง์คํฑ ํ๊ท(Logistic Regression)๋ ์ฃผ๋ก ์ด์ง ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ฌ์ฉ๋๋ ํต๊ณ์ ๋ชจ๋ธ์
๋๋ค.์
๋ ฅ๋ ๋
๋ฆฝ ๋ณ์๋ค์ ์ ํ ๊ฒฐํฉ์ ํตํด ์ข
์ ๋ณ์(์ด์ง ๋ณ์)์ ๋ฐ์ ํ๋ฅ ์ ์์ธกํฉ๋๋ค.๋ก์ง์คํฑ ํ๊ท์ ์ฃผ์ ํน์ง ๋ถ๋ฅ ์๊ณ ๋ฆฌ์ฆ: ์ด์ง ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ์ฃผ๋ก ํด๊ฒฐํ๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค. ๋ค์ค ํด๋์ค ๋ถ๋ฅ ๋ฌธ์ ์์๋ ํ์ฅํ ์ ์์ต๋๋ค.ํ๋ฅ ์ถ๋ ฅ: ์์ธก ๊ฒฐ๊ณผ๋ฅผ 0๊ณผ 1 ์ฌ์ด์ ํ๋ฅ ๊ฐ์ผ๋ก ์ถ๋ ฅํฉ๋๋ค.์ ํ ํ๊ท์์ ์ฐจ์ด์ : ์ ํ ํ๊ท๋ ์ฐ์์ ์ธ ๊ฐ์ ์์ธกํ์ง๋ง, ๋ก์ง์คํฑ ํ๊ท๋ ์ด์ง ๊ฐ์ ์์ธกํฉ๋๋ค.๋ก์ง์คํฑ ํ๊ท์ ๊ธฐ๋ณธ ์๋ฆฌ๊ทธ๋ฌ๋ฉด, Logistic Regre..
๐ Data Engineering/๐ Machine Learning
์ด๋ฒ์๋ K-NN์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.K-NN ์ด๋?K-NN(์ต๊ทผ์ ์ด์ ์๊ณ ๋ฆฌ์ฆ)์ ๋ฐ์ดํฐ ๋ถ๋ฅ ๋ฐ ํ๊ท ๋ฌธ์ ์์ ๋๋ฆฌ ์ฌ์ฉ๋๋ ๋น๋ชจ์์ ๊ธฐ๊ณ ํ์ต ์๊ณ ๋ฆฌ์ฆ์
๋๋ค.์
๋ ฅ ๋ฐ์ดํฐ ํฌ์ธํธ์ ํด๋์ค๋ฅผ ์์ธกํ๊ธฐ ์ํด ๊ทธ ๋ฐ์ดํฐ ํฌ์ธํธ์ ๊ฐ์ฅ ๊ฐ๊น์ด K๊ฐ์ ์ด์์ ๊ธฐ๋ฐ์ผ๋ก ๊ฒฐ์ ์ ๋ด๋ฆฌ๋ ์๊ณ ๋ฆฌ์ฆ์
๋๋ค.K-NN์ ๋ถ๋ฅ(Classification)์ ํ๊ท(Regression) ๋ฌธ์ ๋ชจ๋์ ์ฌ์ฉ๋ ์ ์์ต๋๋ค.K-NN์ ์ฃผ์ ํน์ง1. ๋น๋ชจ์์ ๋ฐฉ๋ฒK-NN์ ๋ฐ์ดํฐ ๋ถํฌ์ ๋ํด ํน์ ํ ๊ฐ์ ์ ํ์ง ์๋ ๋น๋ชจ์์ (non-parametric) ๋ฐฉ๋ฒ์
๋๋ค. ์ด๋ ๋ฐ์ดํฐ์ ํํ๋ ๋ถํฌ์ ๋ํด ์ฌ์ ์ง์์ด ์์ด๋ ์ฌ์ฉํ ์ ์๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.2. ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ๋ชจ๋ธ์ ํ์ตํ๋ ๊ณผ์ ์ด ์๊ณ , ์์ธก ์์ ๋ชจ๋ ํ์ต ๋ฐ์ดํฐ..
๐ Data Engineering/๐น๏ธ ํผ๊ณต๋จธ์
Target์ ๋ชจ๋ฅด๋ Unsupervised Learning(๋น์ง๋ ํ์ต)Target์ ๋ชจ๋ก๋ ๋ฐ์ดํฐ๋ฅผ ์ข
๋ฅ๋ณ๋ก ๋ถ๋ฅํ๋ ค๊ณ ํ ๋ ์ฌ์ฉํ๋ ML ์๊ณ ๋ฆฌ์ฆ์ด ์์ต๋๋ค.๋ฐ๋ก Unsuperivsed Learning (๋น์ง๋ ํ์ต) ์
๋๋ค. ์ฌ๋์ด ์๋ ค์ฃผ์ง ์์๋, ๋ฐ์ดํฐ์ ์๋ ๋ฌด์ธ๊ฐ๋ฅผ ํ์ตํ๋ ๋ฐฉ์์ด๋ผ๊ณ ์๊ฐํ์๋ฉด ํธํฉ๋๋ค.๊ทธ๋ฌ๋ฉด ํ๋ฒ ๋ฐ์ดํฐ๋ฅผ ์ค๋นํด ๋ณด๊ฒ ์ต๋๋ค.Data ์ค๋นํ๊ธฐ์ฌ๊ณผ, ๋ฐ๋๋, ํ์ธ์ ํ๋ก ๊ตฌ์ฑ๋ ํ์ ์ฌ์ง์ ๊ณผ์ผ ๋ฐ์ดํฐ๋ฅผ ์ค๋นํด๋ณด๊ฒ ์ต๋๋ค.!wget https://bit.ly/fruits_300_data -O fruits_300.npy--2023-07-16 14:21:20-- https://bit.ly/fruits_300_dataResolving bit.ly (bit.ly)... 67.199...
๐ Data Engineering/๐ Machine Learning
์ด๋ฒ์๋ Supervised Learning (์ง๋ํ์ต)์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค. Supervised Learning (์ง๋ํ์ต) ์ด๋?์ง๋ํ์ต์ Machine Learning(๊ธฐ๊ณํ์ต)์ ํ ๋ถ์ผ๋ก, ์
๋ ฅ ๋ฐ์ดํฐ์ ๊ทธ์ ๋์ํ๋ ์ ๋ต(๋ ์ด๋ธ)์ ํจ๊ป ์ ๊ณต๋ฐ์ ํ์ตํ๋ ๋ฐฉ๋ฒ์
๋๋ค. ์ด ๊ณผ์ ์ ํตํด ์๊ณ ๋ฆฌ์ฆ์ ์๋ก์ด ์
๋ ฅ ๋ฐ์ดํฐ์ ๋ํด ์ ํํ ์ถ๋ ฅ์ ์์ธกํ ์ ์๋ ๋ชจ๋ธ์ ๋ง๋ญ๋๋ค. ์ฃผ์ํ ํน์ง๋ค์ ๋ฐํ์ฌ ๋ ์ดํด๋ณด๋ฉด 1. ๋ ์ด๋ธ์ด ์๋ ๋ฐ์ดํฐ ์ฌ์ฉ ๊ฐ ๋ฐ์ดํฐ ํฌ์ธํธ์๋ ์
๋ ฅ๊ฐ๊ณผ ๊ทธ์ ๋์ํ๋ ์ ๋ต์ด ํจ๊ป ์ ๊ณต๋ฉ๋๋ค.์๋ฅผ ๋ค์ด, ์ด๋ฏธ์ง ๋ถ๋ฅ ์์
์์๋ ์ด๋ฏธ์ง(์
๋ ฅ)์ ๊ทธ ์ด๋ฏธ์ง๊ฐ ๋ํ๋ด๋ ๊ฐ์ฒด์ ์ด๋ฆ(์ถ๋ ฅ)์ด ์์ ์ด๋ฃน๋๋ค.์ฌ์ง๊ณผ ๊ทธ ์ฌ์ง์ ํ๊ทธ(์: "๊ฐ์์ง", "๊ณ ์์ด")๊ฐ ์์ผ๋ก ์ฃผ์ด์ง๋ฉด, ๋ชจ๋ธ..