๋ฐ์ํ
Intro Object Detection
Object Detection์ Deep Learning(๋ฅ๋ฌ๋) ๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ ํ์์ต๋๋ค.
- Object detection์ ์ปดํจํฐ ๋น์ ๋ถ์ผ์์ ์ค์ํ ์ฐ๊ตฌ ์ฃผ์ ์ค ํ๋๋ก, ์ด๋ฏธ์ง๋ ๋น๋์ค ๋ด์์ ๊ฐ์ฒด์ ์์น๋ฅผ ์ฐพ๊ณ , ํด๋น ๊ฐ์ฒด๊ฐ ๋ฌด์์ธ์ง๋ฅผ ์๋ณํ๋ ๊ธฐ์ ์ ๋๋ค.
- ์ด ๊ธฐ์ ์ ๋ณด์ ์์คํ , ์์จ ์ฃผํ ์ฐจ๋, ์ผ๊ตด ์ธ์, ์ด๋ฏธ์ง ๊ฒ์ ์์ง ๋ฑ ๋ค์ํ ์์ฉ ๋ถ์ผ์์ ํ์ฉ๋ฉ๋๋ค.
- PASCAL VOC ๋ํ์์ convnet์ ์ฌ์ฉํ๊ธฐ ์ ์ด๋ ํ๋ ์ฑ๋ฅ ์งํ๊ฐ ํ ์์นํ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค.
Localization, Detection, Segmentation
Localization, Detection, Segmentation ์ด 3๊ฐ์ ๊ณตํต์ ์ Object์ ์์น๋ฅผ ์ฐพ์์ฃผ๋๊ฒ์ ๋๋ค.
- Localization: ๋จ ํ๋์ Object ์์น๋ฅผ Bounding box๋ก ์ง์ ํ์ฌ ์ฐพ๋ ๊ฒ์ ๋๋ค.
- Detection: ์ฌ๋ฌ ๊ฐ์ Object๋ค์ ๋ํ ์์น๋ฅผ Bounding box๋ก ์ง์ ํ์ฌ ์ฐพ๋๊ฒ์ ๋๋ค..
- Segmentation: Detection๋ณด๋ค ๋ ๋ฐ์ ๋ ํํ๋ก Pixel ๋ ๋ฒจ์ Detection ์ํํฉ๋๋ค.
- ๋ํ Detection ๋ณด๋ค ์ ๊ตํ๋ค๋ ํน์ง์ด ์์ต๋๋ค.
- Localization / Detection์ ํด๋น Object์ ์์น๋ฅผ Bounding box๋ก ์ฐพ๊ณ , Bounding Box๋ด์ Object๋ฅผ ํ๋ณํฉ๋๋ค.
- ๊ทธ๋ฆฌ๊ณ Localization/Detection์ Bounding box regression(box์ ์ขํ๊ฐ๋ค์ ์์ธก)๊ณผ Classification ๋๊ฐ์ ๋ฌธ์ ๊ฐ ํฉ์ณ์ ธ
- ์์ต๋๋ค.
- Localization์ ๋นํด Detection์ 2๊ฐ ์ด์์ Object๋ฅผ ์ด๋ฏธ์ง์ ์์ ์์น์์ ์ฐพ์์ผ ํ๋ฏ๋ก ์๋์ ์ผ๋ก Localization ๋ณด๋ค ์ฌ๋ฌ๊ฐ์ง ์ด๋ ค์ด ๋ฌธ์ ์ ๋ด์ฐฉํ๊ฒ ๋ฉ๋๋ค.
Object Detection์ ์ฃผ์ ๊ตฌ์ฑ์์
- Region Proposal - ์์ญ์ถ์
- ์์ญ ์ถ์ ์ ์ด๋ฏธ์ง ๋ด์์ ๊ฐ์ฒด๊ฐ ์กด์ฌํ ๊ฐ๋ฅ์ฑ์ด ๋์ ์์ญ์ ์๋ณํ๋ ๊ณผ์ ์ ๋๋ค. ์ด๋ ๊ฐ์ฒด ๊ฒ์ถ ์๊ณ ๋ฆฌ์ฆ์ ์ฒซ ๋จ๊ณ๋ก, ์ด๋ฏธ์ง ๋ด์ ๋ชจ๋ ์์น์ ๋ํด ๊ฐ์ฒด๊ฐ ์์ ๊ฐ๋ฅ์ฑ์ ํ๊ฐํ๊ณ , ๊ฐ์ฒด๊ฐ ์์ ๊ฒ ๊ฐ์ ์์น์ ํ๋ณด ์์ญ์ ์ ์ํฉ๋๋ค.
- Detection์ ์ํ Deep Learning Network ๊ตฌ์ฑ
- ๊ฐ์ฒด ๊ฒ์ถ์ ์ํ ๋ฅ๋ฌ๋ ๋คํธ์ํฌ๋ ์ฃผ๋ก Convolutional Neural Networks(CNN)์ ๊ธฐ๋ฐ์ผ๋ก ํฉ๋๋ค. ์ด๋ฌํ ๋คํธ์ํฌ๋ ์ด๋ฏธ์ง๋ก๋ถํฐ ํน์ง์ ์ถ์ถํ๊ณ , ์ด ํน์ง๋ค์ ์ฌ์ฉํ์ฌ ๊ฐ์ฒด์ ์์น์ ํด๋์ค๋ฅผ ๋์์ ์์ธกํฉ๋๋ค.
- Detection์ ๊ตฌ์ฑํ๋ ๊ธฐํ์์
- IOU (Intersection Over Union): IOU๋ ๋ ์์ญ์ ๊ฒน์น๋ ๋ถ๋ถ์ ๋ ์์ญ์ ํฉ์งํฉ์ผ๋ก ๋๋ ๊ฐ์
๋๋ค.
- ์ด๋ ์์ธก๋ bounding box์ ์ค์ ground truth bounding box์ ์ผ์น๋๋ฅผ ์ธก์ ํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค. IOU ๊ฐ์ด ๋์์๋ก, ์์ธก๋ bounding box๊ฐ ์ ํํ๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.
- NMS (Non-Maximum Suppression): NMS๋ ์ฌ๋ฌ ๊ฐ์ bounding box ์ค ๊ฐ์ฅ ํ๋ฅ ์ด ๋์ bounding box๋ฅผ ์ ํํ๊ณ , ๋๋จธ์ง์ ๋ง์ด ๊ฒน์น๋ bounding box๋ฅผ ์ ๊ฑฐํ๋ ๊ณผ์ ์
๋๋ค.
- ์ด๋ ํ ๊ฐ์ฒด์ ๋ํด ์ฌ๋ฌ ๊ฐ์ bounding box๊ฐ ์์ฑ๋๋ ๊ฒ์ ๋ฐฉ์งํฉ๋๋ค.
- mAP (mean Average Precision): mAP๋ ๊ฐ์ฒด ๊ฒ์ถ ๋ชจ๋ธ์ ์ ํ๋๋ฅผ ํ๊ฐํ๋ ์งํ์
๋๋ค.
- ๋ชจ๋ธ์ด ๋ค์ํ ํด๋์ค์ ๋ํด ์ผ๋ง๋ ์ ์๋ํ๋์ง๋ฅผ ์ธก์ ํ๊ธฐ ์ํด, ๊ฐ ํด๋์ค๋ณ Average Precision(AP)์ ๊ณ์ฐํ๊ณ , ์ด๋ฅผ ๋ชจ๋ ํ๊ท ๋ธ ๊ฐ์ ๋๋ค.
- Anchor Box: Anchor box๋ ๋ค์ํ ๋น์จ๊ณผ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง ๊ธฐ์ค ๋ฐ์ค๋ก, ์ด๋ฏธ์ง ๋ด์ ์ ์ฌ์ ๊ฐ์ฒด ์์น๋ฅผ ์์ธกํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
- ์ด๋ RPN๊ณผ ๊ฐ์ ๋คํธ์ํฌ์์ ํ๋ณด ์์ญ์ ์ ์ํ ๋ ์ฌ์ฉ๋๋ฉฐ, ๋ค์ํ ํํ์ ํฌ๊ธฐ์ ๊ฐ์ฒด๋ฅผ ๋ ์ ๊ฐ์งํ ์ ์๊ฒ ํด์ค๋๋ค.
- IOU (Intersection Over Union): IOU๋ ๋ ์์ญ์ ๊ฒน์น๋ ๋ถ๋ถ์ ๋ ์์ญ์ ํฉ์งํฉ์ผ๋ก ๋๋ ๊ฐ์
๋๋ค.
์ฃผ์ Backend CNN Classification
๊ฐ์ฒดํ์ง ๋ชจ๋ธ์ ๋ฐฑ์๋๋ก ์ฌ์ฉ๋๋ CNN ๊ตฌ์กฐ๋ ํน์ง์ถ์ถ(feature extraction) ๋ถ๋ถ์์ ์ค์ํ ์ญํ ์ ํฉ๋๋ค.
- ์ฌ๊ธฐ์ ์ฃผ๋ก Resnet, Inception, Mobilenet์ด ์ฃผ์ํ๊ฒ ์ฌ์ฉ๋๋ Network์ ๋๋ค.
- ์ฌ๊ธฐ์ ์ฃผ์ ๋ฒ์ฉ์ผ๋ก ์ฌ์ฉ๋๋๊ฑด ResNet (Residual Networks)์
๋๋ค.
- ResNet์ ๊น์ ์ ๊ฒฝ๋ง์ ํ๋ จ์ํค๊ธฐ ์ํ ๊ธฐ์ ์ธ ์์ฐจ ํ์ต(residual learning)์ ๋์ ํ์ฌ, ๊น์ ๋คํธ์ํฌ์์ ๋ฐ์ํ ์ ์๋ ์์ค๋ ๊ธฐ์ธ๊ธฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํฉ๋๋ค
- ์ฃผ๋ก Tensorflow Object Detection API๋ก ์ฌ์ฉ๋๋๊ฑด Inception, Mobilenet์ด ์์ต๋๋ค.
- Inception: Inception ๋คํธ์ํฌ๋ ๋ณ๋ ฌ์ ์ธ ์ปจ๋ณผ๋ฃจ์ ๋ ์ด์ด ๊ตฌ์กฐ๋ฅผ ํตํด ๋ค์ํ ํฌ๊ธฐ์ ํํฐ๋ฅผ ์ ์ฉํฉ๋๋ค. ์ด๋ฅผ ํตํด ๋ค์ํ ์ค์ผ์ผ์์ ํน์ฑ์ ์ถ์ถํ ์ ์์ผ๋ฉฐ, ์ด๋ ๊ฐ์ฒด ํ์ง์ ๊ฐ์ด ๋ค์ํ ํฌ๊ธฐ์ ๊ฐ์ฒด๋ฅผ ์ธ์ํด์ผ ํ๋ ๊ฒฝ์ฐ์ ์ ์ฉํฉ๋๋ค.
- MobileNet: MobileNet์ ๊ฒฝ๋ํ๋ ๋ฅ ๋ฌ๋ ๋ชจ๋ธ๋ก, ํนํ ๋ชจ๋ฐ์ผ์ด๋ ์๋ฒ ๋๋ ์์คํ ๊ณผ ๊ฐ์ด ์ฐ์ฐ ๋ฆฌ์์ค๊ฐ ์ ํ๋ ํ๊ฒฝ์์ ์ฌ์ฉํ๊ธฐ ์ํด ์ค๊ณ๋์์ต๋๋ค. MobileNet์ ๊น์ด๋ณ ๋ถ๋ฆฌ ์ปจ๋ณผ๋ฃจ์ (depthwise separable convolution)์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ํฌ๊ธฐ์ ์ฐ์ฐ๋์ ๋ํญ ์ค์ด๋ฉด์๋ ๋์ ์ฑ๋ฅ์ ์ ์งํฉ๋๋ค.
Object Detection์ ๋์
ํฌ๊ฒ 5๊ฐ์ง์ ๋ฌธ์ ๊ฐ ์์ต๋๋ค.
- Classification + Regression์ ๋์์ ํ๋ ๋ฌธ์ ๋ ์ด๋ฏธ์ง์์ ์ฌ๋ฌ ๊ฐ์ ๋ฌผ์ฒด์ classification ํจ๊ณผ ๋์์ ์์น๋ฅผ ์ฐพ์์ผ ํฉ๋๋ค.
- ๋ค์ํ ํฌ๊ธฐ์ ์ ํ์ Object๊ฐ ์์ฌ ์์ต๋๋ค. ์ด๊ฑด ํฌ๊ธฐ๊ฐ ์๋ก ๋ฌ๊ณ , ์๊น์๊ฐ ๋ค๋ฅธ Object๊ฐ ์์ฌ ์๋ ์ด๋ฏธ์ง์์ ์ด๋ค์ Detectํด์ผ ํ๋ ๋ฌธ์ ๊ฐ ์์ต๋๋ค.
- Detect ์๊ฐ์ด ์ค์ํ ์ค์๊ฐ ์์ ๊ธฐ๋ฐ์์ Detect ํด์ผ ํ๋ ์๊ตฌ์ฌํญ์ด ์ฆ๋ ๋๋ค๋ ๋ฌธ์ ๊ฐ ์์ต๋๋ค.
- Object image๊ฐ ๋ช
ํํ์ง ์์ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋ํ ์ ์ฒด ์ด๋ฏธ์ง์์ Detect ํ Object๊ฐ ์ฐจ์งํ๋ ๋น์ค์ด ๋์ง ์์ต๋๋ค.
- ์ฃผ๋ก ๋ฐฐ๊ฒฝ์ด ๋๋ถ๋ถ์ ์ฐจ์งํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค.
- ๋ํ ํ๋ จ ๊ฐ๋ฅํ ๋ฐ์ดํฐ ์ธํธ๊ฐ ๋ถ์กฑํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ annotation์ ๋ง๋ค์ด์ผ ํ๋ฏ๋ก ํ๋ จ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ์์ฑํ๊ธฐ๊ฐ ์๋์ ์ผ๋ก ์ฌ๋ ต๋ค๋ ๋ฌธ์ ๊ฐ ์์ต๋๋ค.
Object Localization ๊ฐ์
Object Localization์ ์ด๋ฏธ์ง ๋ด์์ ํน์ ๊ฐ์ฒด์ ์์น๋ฅผ ์ฐพ์๋ด๋ ๊ณผ์ ์ ์๋ฏธํฉ๋๋ค.
- ์ด๋ ๊ฐ์ฒด ๊ฒ์ถ(Object Detection)์ ํ ๋ถ๋ถ์ผ๋ก, ์ด๋ฏธ์ง์์ ๊ฐ์ฒด๊ฐ ์ด๋์ ์์นํด ์๋์ง๋ฅผ ํ์ ํ๋ ๊ฒ์ ๋๋ค.
- Object Detection๊ณผ ๋ฌ๋ฆฌ, Object Localization์ ์ด๋ฏธ์ง ๋ด์์ ๋จ ํ๋์ ์ฃผ์ ๊ฐ์ฒด์ ์์น๋ง์ ์ฐพ๋ ๊ฒฝ์ฐ๊ฐ ์ผ๋ฐ์ ์ ๋๋ค.
- ์ฃผ์ ๊ณผ์ ์ ๊ฐ๋ตํ๊ฒ ์ค๋ช ๋๋ฆฌ๊ฒ ์ต๋๋ค.
- ์ด๋ฏธ์ง ์ ๋ ฅ: ๋ถ์ํ ์ด๋ฏธ์ง๊ฐ ๋ชจ๋ธ์ ์ ๋ ฅ๋ฉ๋๋ค.
- Feature Extractor: CNN์ ์ฌ๋ฌ ์ธต(convolutional layers, pooling layers ๋ฑ)์ ํต๊ณผํ๋ฉด์ ์ด๋ฏธ์ง์ ์ค์ํ ํน์ง๋ค์ ์ถ์ถํฉ๋๋ค. ์ด๊ธฐ ์ธต์ ์ด๋ฏธ์ง์ ๊ฐ๋จํ ํน์ง(์: ์ฃ์ง, ์์)์ ์ธ์ํ๊ณ , ๊น์ ์ธต์ผ๋ก ๊ฐ์๋ก ๋ณต์กํ ํน์ง(์: ๊ฐ์ฒด์ ์ผ๋ถ๋ถ)์ ์ธ์ํ๊ฒ ๋ฉ๋๋ค.
- Feature Map: CNN์ Layer๋ฅผ ํต๊ณผํ ๊ฒฐ๊ณผ๋ก ์์ฑ๋, ์ด๋ฏธ์ง์ ์ค์ํ ํน์ง๋ค์ด ๋ด๊ธด ๋ฐ์ดํฐ์ ๋๋ค. ์ด๋ฌํ ๋ฐ์ดํฐ๋ค์ ์๋ณธ ์ด๋ฏธ์ง๋ณด๋ค ์ฐจ์์ด ์ค์ด๋ค์๊ฑฐ๋, ํน์ ํน์ง์ด ๊ฐ์กฐ๋ ํํ๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค. ์ด๋ฅผ ํตํด ์ด๋ฏธ์ง์ ์ค์ํ ์ ๋ณด๋ฅผ ๋ณด์กดํ๋ฉด์๋ ๋ฐ์ดํฐ์ ์์ ์ค์ฌ ์ฒ๋ฆฌ ์๋๋ฅผ ๋์ผ ์ ์์ต๋๋ค.
- Fully-Connected Layer (FC-Layer): Feature Map์ ์ ๋ ฅ์ผ๋ก ๋ฐ์, ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ฏธ์ง๊ฐ ์ด๋ค ํด๋์ค์ ์ํ๋์ง๋ฅผ ๊ฒฐ์ ํ๋ ์ญํ ์ ํฉ๋๋ค. ๋ฐฉ์์ Feature Map์ ์ผ๋ ฌ๋ก ํด์(Flatten) ์์ ์ฐ๊ฒฐ ๊ณ์ธต (Fully Connected Layer)์ ์ ๋ ฅํฉ๋๋ค. ์ด ๊ณ์ธต์ ํ์ต๋ ๊ฐ์ค์น๋ฅผ ์ด์ฉํ์ฌ ๊ฐ ํด๋์ค์ ๋ํ ์ ์๋ฅผ ๊ณ์ฐํฉ๋๋ค.
- Softmax Class Score: Fully Connected Layer (FC Layer)์์ ๊ณ์ฐ๋ ์ ์๋ฅผ ํ๋ฅ ๋ก ๋ณํํ์ฌ, ๊ฐ ํด๋์ค์ ์ํ ํ๋ฅ ์ ๋ํ๋ ๋๋ค. ์ด๋ Softmax ํจ์๋ฅผ Activation Function (ํ์ฑํ ํจ์)๋ก ์ฌ์ฉํฉ๋๋ค. ๊ฐ ํด๋์ค์ ๋ํ ์ ์๋ฅผ ํ๋ฅ ๋ก ๋ณํํ์ฌ, ๋ชจ๋ ํด๋์ค์ ํ๋ฅ ํฉ์ด 1์ด ๋๋๋ก ํฉ๋๋ค.
- Object Localization์์ Feature Extractor์์ ์ถ์ถํ ํน์ง์ ๊ธฐ๋ฐ์ผ๋ก, ๊ฐ์ฒด๊ฐ ์ด๋ฏธ์ง ๋ด์ ์กด์ฌํ๋ ์ ํํ ์์น๋ฅผ ๋ํ๋ด๋ Bounding Box์ ์ขํ๊ฐ (x1, y1, x2, y2)๋ฅผ ์์ธกํฉ๋๋ค.
- ์ฌ๊ธฐ์ (x1, y1)์ Bounding Box์ ์ผ์ชฝ ์๋จ ๋ชจ์๋ฆฌ์ ์ขํ์ด๊ณ , (x2, y2)๋ ์ค๋ฅธ์ชฝ ํ๋จ ๋ชจ์๋ฆฌ์ ์ขํ์ ๋๋ค.
- ๊ทธ๋ฆฌ๊ณ Feature Extractor์์ ์ถ์ถํ ํน์ฑ์ ๋ฐํ์ผ๋ก, ๊ฐ์ฒด๊ฐ ์์ ๊ฐ๋ฅ์ฑ์ด ์๋ ์์ญ(Region of Interest, ROI)์ ์ ์ํฉ๋๋ค.
- Object Localization์์๋ ์ด๋ฏธ์ง ์ ์ฒด๋ฅผ ๋์์ผ๋ก ํ๋ค๋ ํน์ง์ด ์์ต๋๋ค.
- ๋ง์ง๋ง์ผ๋ก Bounding Box Regression์ ํตํด ๋ณด์ ๋ Bounding Box์ ์ขํ (x1, y1, x2, y2)๊ฐ ์ต์ข ๊ฒฐ๊ณผ๋ก ์ถ๋ ฅ๋ฉ๋๋ค
- ์ด ์ขํ๋ ์ด๋ฏธ์ง ๋ด์์ ๊ฐ์ฒด์ ์ ํํ ์์น๋ฅผ ๋ํ๋ ๋๋ค.
Object Localization - Bounding Box ํ์ต
- ์์ Object Localization์์ Bounding Box๋ฅผ ํ์ตํ๋ฉด์ Weight(๊ฐ์ค์น)๊ฐ ์ ๋ฐ์ดํธ ๋๋๊ฑด Nerual Network(์ ๊ฒฝ๋ง)์์ ์ ๋ ฅ ์ด๋ฏธ์ง์์ ๊ฐ์ฒด์ ์์น๋ฅผ ๋ ์ ํํ๊ฒ ์์ธกํ๊ธฐ ์ํด ๋ด๋ถ parameter(Weight-๊ฐ์ค์น)๋ฅผ ์กฐ์ ํ๋ค๋ ์๋ฏธ์ ๋๋ค.
- ์ด๋ฌํ ๊ณผ์ ์ ์ฌ๋ฌ ๋ฒ ๋ฐ๋ณตํ๋ฉด์, ์ ๊ฒฝ๋ง์ ์ ์ฐจ ์ค์ ๊ฐ์ฒด์ ์์น๋ฅผ ๋ ์ ํํ๊ฒ ์์ธกํ๋ Bounding Box๋ฅผ ์ถ๋ ฅํ๊ฒ ๋ฉ๋๋ค.
- ์ด๊ธฐ ์์ธก: ์ ๊ฒฝ๋ง์ ์ด๊ธฐ ๊ฐ์ค์น๋ฅผ ๋ฐํ์ผ๋ก ์ ๋ ฅ ์ด๋ฏธ์ง์ ๋ํด Bounding Box์ ์ขํ๋ฅผ ์์ธกํฉ๋๋ค.
- ์์ค ๊ณ์ฐ: ์์ธก๋ Bounding Box์ ์ค์ ๊ฐ์ฒด์ Bounding Box(์ง๋ ํ์ต ๋ฐ์ดํฐ์์ ์ ๊ณต) ์ฌ์ด์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํฉ๋๋ค. ์ด ์ฐจ์ด๋ ์ฃผ๋ก ์์ค ํจ์๋ฅผ ํตํด ๊ณ์ฐ๋๋ฉฐ, ์ด๋ Loss Function(์์ค ํจ์)๋ Mean Squared Error(MSE) ๋๋ Intersection over Union(IoU)๋ฑ ๋ค์ํ Loss Function(์์ค ํจ์)๋ฅผ ์ฌ์ฉํฉ๋๋ค.
- ๊ฐ์ค์น ์ ๋ฐ์ดํธ: ๊ณ์ฐ๋ Loss ์ ๋ฐํ์ผ๋ก, Nerual Network(์ ๊ฒฝ๋ง)์ Backpropagation(์ญ์ ํ) ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ Weight(๊ฐ์ค์น)๋ฅผ ์กฐ์ (update)ํฉ๋๋ค. ์ด ๊ณผ์ ์์ Weight(๊ฐ์ค์น)๋ Loss๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก ์กฐ์ ๋ฉ๋๋ค.
- ์ด๋ ๊ฒ Object Localization์ ์ํํ๋ฉด ์์ธก๊ฒฐ๊ณผ๋ ์๋์ ๊ฐ์ด ๋์ต๋๋ค.
- ๊ทธ๋ฌ๋ฉด ๋ง์ฝ์ 2๊ฐ ์ด์์ Object๋ฅผ ๊ฒ์ถํ๋ ค๊ณ ํ๋ฉด ์ด๋ฏธ์ง์ ์ด๋ ์์น์์ Object๋ฅผ ์ฐพ์์ผ ํ ๊น์? ๊ทธ๊ฑด ๋ค์ ๊ธ์์ ์ค๋ช ํด ๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๋ฐ์ํ
'๐ Computer Vision' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[CV] OpenCV ์์์ฒ๋ฆฌ ๊ฐ์ (0) | 2024.05.19 |
---|---|
[CV] OpenCV ๊ฐ์ (0) | 2024.05.18 |
[CV] Object Detection & Segmentation์ ์ํ ์ฃผ์ Dataset (0) | 2024.05.17 |
[CV] Precision(์ ๋ฐ๋) & Recall(์ฌํ์จ) (0) | 2024.05.15 |
[CV] Object Detection ๋ฐฉ์ & ์ฑ๋ฅ ํ๊ฐ (0) | 2024.05.13 |