๐ Computer Vision
Object Detection & Segmentation์ ์ํ ๋ค์ํ ํจํค์ง๋คObject Detection & Segmentation์ ์ํ ๋ค์ํ ํจํค์ง๋ค์ด ์์ต๋๋ค.Keras์ Tensorflow ๊ธฐ๋ฐ์ ๋ค์ํ ์คํ์์ค ํจํค์ง๋ค์ฌ์ด ํ์ฉ๊ณผ Customization ๊ฐ๋ฅํ ์ฅ์ ์ด ์์ต๋๋ค.๋ค๋ง Object Detection ์๊ณ ๋ฆฌ์ฆ ๋ณ๋ก ์๋ก ๋ค๋ฅธ ํจํค์ง๋ค์ ์ ์ฉํด์ผ ํ๋ ๋จ์ ์ด ์์ต๋๋ค.OpenCV ์ DNN(Deep Neural Network) ๋ชจ๋๊ฐํธํ๊ฒ Object Detection Inference๊ฐ ๊ฐ๋ฅํฉ๋๋ค.๋ค๋ง ํ์ต์ด ๋ถ๊ฐ๋ฅํ๋ฉฐ ์ฃผ๋ก CPU ์์ฃผ๋ก GPU ํ์ฉ์ด ์ด๋ ต๋ค๋ ์ ์ด ์์ต๋๋ค.Tensorflow Object Detection API๊ฐ์ฅ ๋ง์ Detection ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉ์ด ..
๐ Computer Vision
OpenCV ์์ ์ฒ๋ฆฌ ๊ฐ์ํ๋ฒ OpenCV์ ์์์ฒ๋ฆฌ ๋ฐฉ๋ฒ์ ๋ฐํ์ฌ ์์๋ณด๊ฒ ์ต๋๋ค.OpenCV์ VideoCaptureํด๋์ค๋ ๋์์์ ๊ฐ๋ณ Frame์ผ๋ก ํ๋์ฉ ์ฝ์ด(Read)๋ค์ด๋ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค.VideoWriter๋ VideoCapture๋ก ์ฝ์ด๋ค์ธ ๊ฐ๋ณ Frame์ ๋์์ ํ์ผ๋ก Write๋ฅผ ์ํํฉ๋๋ค.VideoCapture.read() - ์์์ ๋ค์ Frame์ ์ฝ์ต๋๋ค.VideoWriter.write() - ์์์ Frame์ write ํฉ๋๋ค.cap = cv2.VideoCapture(video_input_path)…………vid_writer = cv2.VideoWriter(video_output_path, …..)while True:hasFrame, img_frame = cap.read..
๐ Computer Vision
Python ๊ธฐ๋ฐ ์ฃผ์ ์ด๋ฏธ์ง ๋ผ์ด๋ธ๋ฌ๋ฆฌํฌ๊ฒ 3๊ฐ์ง๊ฐ ์์ต๋๋ค.PIL (Python Image Library)์ฃผ๋ก ์ด๋ฏธ์ง ์ฒ๋ฆฌ๋ง์ ์ํด ์ฌ์ฉํฉ๋๋ค.์ฒ๋ฆฌ ์ฑ๋ฅ์ด ์๋์ ์ผ๋ก ๋๋ฆฌ๋ค๋ ๋จ์ ์ด ์์ต๋๋ค.Scikit-Imageํ์ด์ฌ ๊ธฐ๋ฐ์ ์ ๋ฐ์ ์ธ ์ปดํจํฐ ๋น์ ๊ธฐ๋ฅ ์
๋๋ค.์ฌ์ดํ์ด(Scipy)์ ๊ธฐ๋ฐํ๊ณ ์์ต๋๋ค.OpenCV์คํ์์ค ๊ธฐ๋ฐ์ ์ต๊ณ ์ธ๊ธฐ ์ปดํจํฐ ๋น์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์
๋๋ค.์ปดํจํฐ ๋น์ ๊ธฐ๋ฅ ์ผ๋ฐํ์ ํฌ๊ฒ ๊ธฐ์ฌ ํ๋ค๋ ํน์ง์ด ์์ต๋๋ค.(์ด๋ ค์ด ๊ธฐ๋ฅ๋ API ๋ช์ค๋ก ๊ฐ๋จํ๊ฒ ๊ตฌํ์ด ๊ฐ๋ฅํฉ๋๋ค.)C++ ๊ธฐ๋ฐ์ด๋ Python๋ ์ง์ํฉ๋๋ค. (Java, C# ๋ฑ ๋ค์ํ ์ธ์ด ์ง์) OpenCV ํน์งOpenCV (Open Source Computer Vision Library)๋ ์ปดํจํฐ ๋น์ ๊ณผ ๋จธ์ ๋ฌ๋์ ์ํ ์คํ..
๐ Computer Vision
์ฃผ์ Dataset๋ง์ Detection & Segmentation DL ํจํค์ง๊ฐ ์๋์ Dataset๋ค์ ๊ธฐ๋ฐ์ผ๋ก Pretrained ๋์ด ๋ฐฐํฌ๋์์ต๋๋ค.PASCAL VOC: XML Format, 20๊ฐ์ Object CategoryBounding Box ์์์ผ๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค(XML), ๊ทธ๋ฆฌ๊ณ ํ๋์ Image์ ๋ฐํ์ฌ Annotation ํฉ๋๋ค. MS COCO: json Form, 80๊ฐ์ ์ค๋ธ์ ํธ ์นดํ
๊ณ ๋ฆฌGoogle Open Images: csv Format, 600๊ฐ์ ์ค๋ธ์ ํธ ์นดํ
๊ณ ๋ฆฌ PASCAL VOC 2012PASCAL VOC(Pattern Analysis, Statistical Modelling and Computational Learning Visual Object Classes)..
๐ Computer Vision
Precision(์ ๋ฐ๋) & Recall(์ฌํ์จ)์ ๋ฐ๋(Precision)๊ณผ ์ฌํ์จ(Recall)์ ์ฃผ๋ก Binary Classification(์ด์ง ๋ถ๋ฅ)์์ ์ฌ์ฉ๋๋ ์ฑ๋ฅ์งํ ์
๋๋ค.์ ๋ฐ๋(Precision)๋ ์์ธก์ Positive๋ก ํ ๋์ ์ค์ ์์ธก๊ณผ ์ค์ ๊ฐ์ด Positive๋ก ์ผ์นํ ๋ฐ์ดํฐ์ ๋น์จ์ ๋ปํฉ๋๋ค.Object Detection์์๋ ๊ฒ์ถ ์๊ณ ๋ฆฌ์ฆ์ด ๊ฒ์ถ ์์ธกํ ๊ฒฐ๊ณผ๊ฐ ์ค์ Object๋ค๊ณผ ์ผ๋ง๋ ์ผ์นํ๋์ง๋ฅผ ๋ํ๋ด๋ ์งํ์
๋๋ค.์ฌํ์จ(Recall)์ ์ค์ ๊ฐ์ด Positive์ธ ๋์ ์ค์ ์์ธก๊ณผ ์ค์ ๊ฐ์ด Positive๋ก ์ผ์นํ ๋ฐ์ดํฐ์ ๋น์จ์ ๋ปํฉ๋๋ค. ObjectDetection์์๋ ๊ฒ์ถ ์๊ณ ๋ฆฌ์ฆ์ด ์ค์ Object๋ค์ ๋น ๋จ๋ฆฌ์ง ์๊ณ ์ผ๋ง๋ ์ ํํ ๊ฒ์ถ ์์ธกํ๋์ง๋ฅผ ๋ํ๋ด..
๐ Computer Vision
์ด๋ฒ ๊ธ์์๋ ํ๋ฒ Object Detection์ ๋ฐฉ์๋ค์ด ์ด๋ค๊ฒ์ด ์๋์ง ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.Sliding Window ๋ฐฉ์Sliding Window ๋ฐฉ์์ Window๋ฅผ ์ผ์ชฝ ์๋จ๋ถํฐ ์ค๋ฅธ์ชฝ ํ๋จ์ผ๋ก ์ด๋์ํค๋ฉด์ Object๋ฅผ Detection ํ๋ ๋ฐฉ์์
๋๋ค.์ฝ๊ฐ ์ด์ดํ, ์ธ๋ฐํ๊ฒ window๋ฅผ ์ด๋์ํค๋ฉด์ ๊ฐ์ฒด ํ์ง๋ฅผ ํ๋ ๋ฐฉ์์
๋๋ค. ์ด๋ฏธ์ง๋ฅผ ์์ ์์ญ์ผ๋ก ๋๋๊ณ , ๊ฐ๊ฐ์ ์์ ์์ญ(์๋์ฐ)์์ ๊ฐ์ฒด๊ฐ ์กด์ฌํ๋์ง๋ฅผ ํ์งํ๋ ๋ฐฉ๋ฒ์
๋๋ค.์ฅ์ ์ ๋ง์ ์์ญ์ Scan ํ ์ ์๋๊ฒ, Window์ ํํ๋ Image Scale์ ๋ค์ํ๊ฒ ๋ณ๊ฒฝํ ์ ์๋ค๋ ์ ์
๋๋ค.๋จ์ ์ Object ์๋ ์์ญ๋ ๋ฌด์กฐ๊ฑด ์ฌ๋ผ์ด๋ฉ ํ์ฌ์ผ ํ๋ฉฐ ์ฌ๋ฌ ํํ์ Window์ ์ฌ๋ฌ Scale์ ๊ฐ์ง ์ด๋ฏธ์ง๋ฅผ ์ค์บํด์ ๊ฒ์ถํด์ผ ํ..
๐ Computer Vision
Intro Object DetectionObject Detection์ Deep Learning(๋ฅ๋ฌ๋) ๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ ํ์์ต๋๋ค.Object detection์ ์ปดํจํฐ ๋น์ ๋ถ์ผ์์ ์ค์ํ ์ฐ๊ตฌ ์ฃผ์ ์ค ํ๋๋ก, ์ด๋ฏธ์ง๋ ๋น๋์ค ๋ด์์ ๊ฐ์ฒด์ ์์น๋ฅผ ์ฐพ๊ณ , ํด๋น ๊ฐ์ฒด๊ฐ ๋ฌด์์ธ์ง๋ฅผ ์๋ณํ๋ ๊ธฐ์ ์
๋๋ค.์ด ๊ธฐ์ ์ ๋ณด์ ์์คํ
, ์์จ ์ฃผํ ์ฐจ๋, ์ผ๊ตด ์ธ์, ์ด๋ฏธ์ง ๊ฒ์ ์์ง ๋ฑ ๋ค์ํ ์์ฉ ๋ถ์ผ์์ ํ์ฉ๋ฉ๋๋ค.PASCAL VOC ๋ํ์์ convnet์ ์ฌ์ฉํ๊ธฐ ์ ์ด๋ ํ๋ ์ฑ๋ฅ ์งํ๊ฐ ํ ์์นํ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค.Localization, Detection, SegmentationLocalization, Detection, Segmentation ์ด 3๊ฐ์ ๊ณตํต์ ์ Object์ ์์น๋ฅผ ์ฐพ์์ฃผ๋๊ฒ์
๋๋ค.L..