๐ Machine Learning
Hierarchical Clustering (๊ณ์ธต์ ๊ตฐ์ง ๋ถ์)๋ Unsupervised Learning (๋น์ง๋ ํ์ต) ๊ณ์ธต์ ๊ตฐ์ง ๋ถ์์ ๋ฐ์ดํฐ ํฌ์ธํธ๋ค ๊ฐ์ ์ ์ฌ๋๋ฅผ ๋ฐํ์ผ๋ก ๊ณ์ธต์ ์ธ ๊ตฐ์ง ๊ตฌ์กฐ๋ฅผ ํ์ฑํ๋ ๊ตฐ์งํ ๋ฐฉ๋ฒ์
๋๋ค.์ด ๋ฐฉ๋ฒ์ ๋ฐ์ดํฐ๋ฅผ ํธ๋ฆฌ ๊ตฌ์กฐ๋ก ํํํ๋ฉฐ, ๋จ๊ณ๋ณ๋ก ๊ตฐ์งํ๋ฅผ ์งํํจ์ผ๋ก์จ ๋ฐ์ดํฐ ๊ฐ์ ๊ด๊ณ์ ๊ตฌ์กฐ๋ฅผ ์ดํดํ๋ ๋ฐ ๋์์ ์ค๋๋ค.Hierarchical Clustering (๊ณ์ธต์ ๊ตฐ์ง ๋ถ์)์ ์ ํ๊ทธ๋ฌ๋ฉด, Hierarchical Clustering (๊ณ์ธต์ ๊ตฐ์ง ๋ถ์)์ ์ ํ์ ์ด๋ ํ ๊ฒ์ด ์์๊น์? ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค. 1. ๋ณํฉ์ ๊ตฐ์งํ (Agglomerative Clustering)๋ณํฉ์ ๊ตฐ์งํ๋ ๊ฐ ๋ฐ์ดํฐ๋ฅผ ํ๋์ ๊ตฐ์ง์ผ๋ก ์์ํ์ฌ, ๊ฐ์ฅ ๊ฐ๊น์ด ๊ตฐ์ง๋ค์ ๋ฐ๋ณต์ ์ผ๋ก ๋ณํฉํด..
๐ Machine Learning
์์ ๊ธ์์ ๋น์ง๋ํ์ต์ ๊ธฐ๋ฒ๋ค์ ๋ฐํ์ฌ ์์๋ณด์์ต๋๋ค.์ด๋ฒ์๋ ๊ทธ ์ค ํ๋์ธ K-Means Clustering (K-ํ๊ท ํด๋ฌ์คํฐ๋ง)์ ๋ฐํ์ฌ ์์๋ณด๊ฒ ์ต๋๋ค. K-ํ๊ท ํด๋ฌ์คํฐ๋ง์ ๋ฐ์ดํฐ๋ฅผ K๊ฐ์ ๊ตฐ์ง์ผ๋ก ๋๋์ด ๊ฐ ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ์ ์ฌํ ํน์ฑ์ ๊ฐ์ง ๊ทธ๋ฃน์ผ๋ก ๋ฌถ๋ ๊ตฐ์งํ ์๊ณ ๋ฆฌ์ฆ์
๋๋ค.์ด๋ฅผ ํตํด ๋ฐ์ดํฐ์ ๊ตฌ์กฐ๋ฅผ ์ดํดํ๊ณ , ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ์๊ฐํ๋ฅผ ์ฉ์ดํ๊ฒ ํ ์ ์์ต๋๋ค.K-Means Clustering์ ํน์งK-ํ๊ท ํด๋ฌ์คํฐ๋ง์ ํน์ง์ ์ฌ๋ฌ๊ฐ๊ฐ ์์ต๋๋ค. ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค. 1. ๊ตฐ์ง ์ K: ์ฌ์ฉ์๊ฐ ๊ตฐ์ง ์ K๋ฅผ ์ฌ์ ์ ์ ์ํด์ผ ํ๋ฉฐ, ์ด ๊ฐ์ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ง๊ฒฐ๋๋ ์ค์ํ ํ์ดํผํ๋ผ๋ฏธํฐ์
๋๋ค.์ ์ ํ K๋ฅผ ์ ํํ๋ ๊ฒ์ด ๊ตฐ์งํ์ ์ฑ๊ณต ์ฌ๋ถ์ ํฐ ์ํฅ์ ๋ฏธ์นฉ๋๋ค. 2. ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ ์๊ณ ๋ฆฌ์ฆ: K..
๐ Machine Learning
์ด๋ฒ์๋ ๋น์ง๋ ํ์ต์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.๋น์ง๋ ํ์ต(Unsupervised Learning)์ ๋ ์ด๋ธ์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ๋ด์ ํจํด์ด๋ ๊ตฌ์กฐ๋ฅผ ๋ฐ๊ฒฌํ๋ ๋จธ์ ๋ฌ๋ ๋ฐฉ๋ฒ์
๋๋ค.์ด ํ์ต ๋ฐฉ์์ ๋ฐ์ดํฐ์ ์ฌ์ ์ง์ ์์ด ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ , ๊ทธ ์์ ์จ๊ฒจ์ง ์๋ฏธ ์๋ ๊ตฌ์กฐ๋ ๊ด๊ณ๋ฅผ ๋ฐ๊ฒฌํ๋ ๋ฐ ์ค์ ์ ๋ก๋๋ค.Unsupervised Learning (๋น์ง๋ ํ์ต) ์ฃผ์ ํน์ง๋ ์ด๋ธ ์์: ๋น์ง๋ ํ์ต์ ๋ ์ด๋ธ์ด๋ ๋ชฉํ ๋ณ์๊ฐ ์๋ ์
๋ ฅ ๋ฐ์ดํฐ๋ง์ ์ฌ์ฉํฉ๋๋ค. ์ด๋ ๋ ์ด๋ธ๋ง์ด ์ด๋ ต๊ฑฐ๋ ๋ถ๊ฐ๋ฅํ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์ ๋ค๋ฃฐ ๋ ์ ์ฉํฉ๋๋ค.ํจํด ๋ฐ๊ฒฌ: ๋น์ง๋ ํ์ต์ ๋ฐ์ดํฐ ๋ด์์ ์จ๊ฒจ์ง ํจํด์ด๋ ๊ตฌ์กฐ๋ฅผ ํ์ํ์ฌ ๋ฐ์ดํฐ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ดํดํ๋ ค๊ณ ํฉ๋๋ค. ์ด๋ฌํ ํจํด ๋ฐ๊ฒฌ์ ๋ฐ์ดํฐ์ ๋ณธ์ง์ ์ธ ํน์ฑ์ ์ดํดํ๋ ..
๐ Machine Learning
์ด๋ฒ์๋ ๋ค์ธต ํผ์
ํธ๋ก (Multilayer Perceptron, MLP)์ ๋ฐํ์ฌ ์์๋ณด๊ฒ ์ต๋๋ค. ๋ค์ธต ํผ์
ํธ๋ก (Multilayer Perceptron, MLP)๋ค์ธต ํผ์
ํธ๋ก (Multilayer Perceptron, MLP)์ ๊ธฐ๋ณธ์ ์ธ ์ธ๊ณต ์ ๊ฒฝ๋ง์ ํํ ์ค ํ๋๋ก, ํนํ ๋ณต์กํ ๋น์ ํ ๊ด๊ณ์ ํจํด์ ํ์ตํ ์ ์๋ ๋ฅ๋ ฅ์ผ๋ก ์ธํด ๋ถ๋ฅ ๋ฐ ํ๊ท ๋ฌธ์ ์ ๋๋ฆฌ ์ฌ์ฉ๋ฉ๋๋ค. ๊ธฐ๋ณธ ๊ตฌ์กฐ๋ ์
๋ ฅ์ธต, ํ๋ ์ด์์ ์๋์ธต, ๊ทธ๋ฆฌ๊ณ ์ถ๋ ฅ์ธต์ผ๋ก ์ด๋ฃจ์ด์ง FeedForward ์ ๊ฒฝ๋ง ์ด๋ฉฐ, ๊ฐ ์ธต์ ์ฌ๋ฌ ๋ด๋ฐ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.๋ํ ๊ฐ ๋ด๋ฐ์ ์ด์ ์ธต์ ๋ด๋ฐ์ผ๋ก๋ถํฐ ์
๋ ฅ์ ๋ฐ์ ๊ฐ์ค์น๋ฅผ ์ ์ฉํ๊ณ , ํ์ฑํ ํจ์๋ฅผ ํตํด ์ถ๋ ฅ์ ์์ฑํฉ๋๋ค.๋ค์ธต ํผ์
ํธ๋ก (Multilayer Perceptron, MLP)์ ๊ตฌ์กฐ๋ค์ธต ํผ์
ํธ๋ก ์ ๊ตฌ์กฐ๋ ..
๐ Machine Learning
์ด๋ฒ์๋ Random Forest (๋๋ค ํฌ๋ ์คํธ) ๊ธฐ๋ฒ์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค. ๋๋ค ํฌ๋ ์คํธ(Random Forest)๋ ๊ฒฐ์ ํธ๋ฆฌ์ ์์๋ธ ๋ฐฉ๋ฒ ์ค ํ๋๋ก, ์ฌ๋ฌ ๊ฐ์ ๊ฒฐ์ ํธ๋ฆฌ๋ฅผ ์์ฑํ๊ณ ๊ทธ ์์ธก์ ๊ฒฐํฉํ์ฌ ๋์ฑ ๊ฐ๋ ฅํ๊ณ ์์ ์ ์ธ ๋ชจ๋ธ์ ๋ง๋๋ ๋ฐฉ๋ฒ์
๋๋ค. ์ด ๋ฐฉ๋ฒ์ ํนํ ๋ถ๋ฅ์ ํ๊ท ๋ฌธ์ ์ ํจ๊ณผ์ ์ด๋ฉฐ, ๊ฐ๋ณ ๊ฒฐ์ ํธ๋ฆฌ์ ๊ณผ์ ํฉ ๋ฌธ์ ๋ฅผ ๊ทน๋ณตํ๊ณ , ์ ์ฒด์ ์ธ ์์ธก ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋ฐ ๋์์ ์ค๋๋ค. Random Forest (๋๋ค ํฌ๋ ์คํธ)์ ์ฃผ์ ํน์ง๋ค์์ฑ (Diversity)๋๋ค ํฌ๋ ์คํธ๋ ๊ฐ๊ฐ์ ๊ฒฐ์ ํธ๋ฆฌ๊ฐ ๋ฐ์ดํฐ์ ์๋ก ๋ค๋ฅธ ๋ถ๋ถ์งํฉ๊ณผ ํน์ฑ์ ์ฌ์ฉํ์ฌ ํ์ตํฉ๋๋ค. ์ด๋ ๊ฐ ํธ๋ฆฌ๊ฐ ๋
๋ฆฝ์ ์ผ๋ก ๋ค๋ฅธ ํจํด์ ํ์ตํ๋๋ก ํ์ฌ ๋ชจ๋ธ ์ ์ฒด์ ๋ค์์ฑ์ ๋์
๋๋ค.์ด๋ฌํ ์ ๊ทผ ๋ฐฉ์์ ํธ๋ฆฌ ๊ฐ์ ์๊ด๊ด๊ณ..
๐ Machine Learning
์ด๋ฒ์๋ Decision Tree (๊ฒฐ์ ํธ๋ฆฌ)์ ๋ฐํ์ฌ ์์๋ณด๊ฒ ์ต๋๋ค. ๊ฒฐ์ ํธ๋ฆฌ(Decision Tree)๋ ๋ถ๋ฅ์ ํ๊ท ๋ฌธ์ ์ ๋ชจ๋ ์ฌ์ฉ๋ ์ ์๋ ์ง๋ํ์ต ์๊ณ ๋ฆฌ์ฆ์
๋๋ค.์ด ๋ชจ๋ธ์ ๋ฐ์ดํฐ๋ฅผ ํธ๋ฆฌ ๊ตฌ์กฐ๋ก ๋ถํ ํ์ฌ ์์ธก์ ์ํํ๋ฉฐ, ๊ฐ ๋ด๋ถ ๋
ธ๋๋ ํน์ ์กฐ๊ฑด์ ๋ฐ๋ฅธ ๋ฐ์ดํฐ ๋ถํ ์ ๋ํ๋ด๊ณ , ๊ฐ์ง(branch)๋ ๊ทธ ์กฐ๊ฑด์ ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋ด๋ฉฐ, ์ต์ข
๋ฆฌํ ๋
ธ๋(leaf node)๋ ์์ธก ๊ฐ์ ์ ๊ณตํฉ๋๋ค.Decision Tree์ ์ฃผ์ ํน์ง์ง๊ด์ฑ: ๊ฒฐ์ ํธ๋ฆฌ๋ ์๊ฐ์ ์ผ๋ก ํํํ ์ ์์ด ์ดํด๊ฐ ์ฝ์ต๋๋ค.๋น๋ชจ์์ ๋ฐฉ๋ฒ: ๋ฐ์ดํฐ์ ๋ถํฌ์ ๋ํด ํน์ ๊ฐ์ ์ ํ์ง ์์ผ๋ฏ๋ก ๋ค์ํ ๋ฐ์ดํฐ์
์ ์ ์ฉ ๊ฐ๋ฅํฉ๋๋ค.ํด์ ์ฉ์ด์ฑ: ๋ชจ๋ธ์ด ์ด๋ป๊ฒ ๊ฒฐ์ ์ ๋ด๋ ธ๋์ง ์ฝ๊ฒ ํด์ํ ์ ์์ต๋๋ค.Decision Tree์ ๊ธฐ๋ณธ ์๋ฆฌ๋
ธ๋์..
๐ Machine Learning
์ด๋ฒ์๋ Support Vector Machine (์ํฌํธ ๋ฒกํฐ ๋จธ์ )์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค. ์ํฌํธ ๋ฒกํฐ ๋จธ์ (Support Vector Machine, SVM)์ ๋ณต์กํ ๋ฐ์ดํฐ์
์์๋ ํจ๊ณผ์ ์ธ ๋ถ๋ฅ๋ฅผ ์ํํ ์ ์๋ ๊ฐ๋ ฅํ ์ง๋ํ์ต ์๊ณ ๋ฆฌ์ฆ์
๋๋ค. ์ด ์๊ณ ๋ฆฌ์ฆ์ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฆฌํ๋ ์ต์ ์ ์ดํ๋ฉด(๊ฒฐ์ ๊ฒฝ๊ณ)์ ์ฐพ์๋ด๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.SVM์ ์ฃผ์ ํน์ง๊ณผ ์๋ฆฌ๋ฅผ ์์ธํ ์ดํด๋ณด๊ฒ ์ต๋๋ค. Support Vector Machine (SVM)์ ์ฃผ์ ํน์ง๊ฒฐ์ ์ดํ๋ฉด(Decision Hyperplane): ๋ ํด๋์ค๋ฅผ ๋ถ๋ฆฌํ๋ ๊ฐ์ฅ ์ข์ ์ดํ๋ฉด์ ์ฐพ์ต๋๋ค. ์ด ํ๋ฉด์ ๋ ํด๋์ค ๊ฐ์ ๋ง์ง(๊ฑฐ๋ฆฌ)์ ์ต๋ํํฉ๋๋ค.w: ์ดํ๋ฉด์ ๋ฒ์ ๋ฒกํฐ, x: ๋ฐ์ดํฐ ํฌ์ธํธ, b: ์ ํธw * x + b = 0์ํฌํธ ๋ฒกํฐ..
๐ Machine Learning
์ด๋ฒ์ Logistic Regression (๋ก์ง์คํฑ ํ๊ท)์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.Logistic Regression (๋ก์ง์คํฑ ํ๊ท)๋ก์ง์คํฑ ํ๊ท(Logistic Regression)๋ ์ฃผ๋ก ์ด์ง ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ฌ์ฉ๋๋ ํต๊ณ์ ๋ชจ๋ธ์
๋๋ค.์
๋ ฅ๋ ๋
๋ฆฝ ๋ณ์๋ค์ ์ ํ ๊ฒฐํฉ์ ํตํด ์ข
์ ๋ณ์(์ด์ง ๋ณ์)์ ๋ฐ์ ํ๋ฅ ์ ์์ธกํฉ๋๋ค.๋ก์ง์คํฑ ํ๊ท์ ์ฃผ์ ํน์ง ๋ถ๋ฅ ์๊ณ ๋ฆฌ์ฆ: ์ด์ง ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ์ฃผ๋ก ํด๊ฒฐํ๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค. ๋ค์ค ํด๋์ค ๋ถ๋ฅ ๋ฌธ์ ์์๋ ํ์ฅํ ์ ์์ต๋๋ค.ํ๋ฅ ์ถ๋ ฅ: ์์ธก ๊ฒฐ๊ณผ๋ฅผ 0๊ณผ 1 ์ฌ์ด์ ํ๋ฅ ๊ฐ์ผ๋ก ์ถ๋ ฅํฉ๋๋ค.์ ํ ํ๊ท์์ ์ฐจ์ด์ : ์ ํ ํ๊ท๋ ์ฐ์์ ์ธ ๊ฐ์ ์์ธกํ์ง๋ง, ๋ก์ง์คํฑ ํ๊ท๋ ์ด์ง ๊ฐ์ ์์ธกํฉ๋๋ค.๋ก์ง์คํฑ ํ๊ท์ ๊ธฐ๋ณธ ์๋ฆฌ๊ทธ๋ฌ๋ฉด, Logistic Regre..
๐ Machine Learning
์ด๋ฒ์๋ K-NN์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.K-NN ์ด๋?K-NN(์ต๊ทผ์ ์ด์ ์๊ณ ๋ฆฌ์ฆ)์ ๋ฐ์ดํฐ ๋ถ๋ฅ ๋ฐ ํ๊ท ๋ฌธ์ ์์ ๋๋ฆฌ ์ฌ์ฉ๋๋ ๋น๋ชจ์์ ๊ธฐ๊ณ ํ์ต ์๊ณ ๋ฆฌ์ฆ์
๋๋ค.์
๋ ฅ ๋ฐ์ดํฐ ํฌ์ธํธ์ ํด๋์ค๋ฅผ ์์ธกํ๊ธฐ ์ํด ๊ทธ ๋ฐ์ดํฐ ํฌ์ธํธ์ ๊ฐ์ฅ ๊ฐ๊น์ด K๊ฐ์ ์ด์์ ๊ธฐ๋ฐ์ผ๋ก ๊ฒฐ์ ์ ๋ด๋ฆฌ๋ ์๊ณ ๋ฆฌ์ฆ์
๋๋ค.K-NN์ ๋ถ๋ฅ(Classification)์ ํ๊ท(Regression) ๋ฌธ์ ๋ชจ๋์ ์ฌ์ฉ๋ ์ ์์ต๋๋ค.K-NN์ ์ฃผ์ ํน์ง1. ๋น๋ชจ์์ ๋ฐฉ๋ฒK-NN์ ๋ฐ์ดํฐ ๋ถํฌ์ ๋ํด ํน์ ํ ๊ฐ์ ์ ํ์ง ์๋ ๋น๋ชจ์์ (non-parametric) ๋ฐฉ๋ฒ์
๋๋ค. ์ด๋ ๋ฐ์ดํฐ์ ํํ๋ ๋ถํฌ์ ๋ํด ์ฌ์ ์ง์์ด ์์ด๋ ์ฌ์ฉํ ์ ์๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.2. ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ๋ชจ๋ธ์ ํ์ตํ๋ ๊ณผ์ ์ด ์๊ณ , ์์ธก ์์ ๋ชจ๋ ํ์ต ๋ฐ์ดํฐ..
๐น๏ธ ํผ๊ณต๋จธ์
Target์ ๋ชจ๋ฅด๋ Unsupervised Learning(๋น์ง๋ ํ์ต)Target์ ๋ชจ๋ก๋ ๋ฐ์ดํฐ๋ฅผ ์ข
๋ฅ๋ณ๋ก ๋ถ๋ฅํ๋ ค๊ณ ํ ๋ ์ฌ์ฉํ๋ ML ์๊ณ ๋ฆฌ์ฆ์ด ์์ต๋๋ค.๋ฐ๋ก Unsuperivsed Learning (๋น์ง๋ ํ์ต) ์
๋๋ค. ์ฌ๋์ด ์๋ ค์ฃผ์ง ์์๋, ๋ฐ์ดํฐ์ ์๋ ๋ฌด์ธ๊ฐ๋ฅผ ํ์ตํ๋ ๋ฐฉ์์ด๋ผ๊ณ ์๊ฐํ์๋ฉด ํธํฉ๋๋ค.๊ทธ๋ฌ๋ฉด ํ๋ฒ ๋ฐ์ดํฐ๋ฅผ ์ค๋นํด ๋ณด๊ฒ ์ต๋๋ค.Data ์ค๋นํ๊ธฐ์ฌ๊ณผ, ๋ฐ๋๋, ํ์ธ์ ํ๋ก ๊ตฌ์ฑ๋ ํ์ ์ฌ์ง์ ๊ณผ์ผ ๋ฐ์ดํฐ๋ฅผ ์ค๋นํด๋ณด๊ฒ ์ต๋๋ค.!wget https://bit.ly/fruits_300_data -O fruits_300.npy--2023-07-16 14:21:20-- https://bit.ly/fruits_300_dataResolving bit.ly (bit.ly)... 67.199...