๐ Computer Vision
2024.07.15
OpenCV DNN์ผ๋ก YOLO Inference ๊ตฌํ์ ์ ์ ์ฌํญYOLO ๋ชจ๋ธ ๊ตฌํ์ ์์๋์ด์ผ ํ ์ ์, OpenCV YOLO Inference Code๋ ๊ธฐ์กด OpenCV inference ์ฝ๋์๋ ๋ค๋ฆ
๋๋ค.๋ํ Darknet ๊ตฌ์ฑ ํ๊ฒฝ ๋ฐ YOLO Architecture์ ๋ฐ๋ผ ์ฌ์ฉ์๊ฐ ์ง์ Object Detection ์ ๋ณด๋ฅผ ์ถ์ถํด์ผ ํฉ๋๋ค.Pretrained๋ inference ๋ชจ๋ธ ๋ก๋ฉ ๋ฐฉ๋ฒWeight ๋ชจ๋ธ ํ์ผ๊ณผ config ํ์ผ์ Darknet ์ฌ์ดํธ์ Download๊ฐ ๊ฐ๋ฅํฉ๋๋ค.cv2.dnn.readNetFromDarknet(config ํ์ผ, weight ๋ชจ๋ธ ํ์ผ)์ผ๋ก pretrained๋ inference ๋ชจ๋ธ์ ๋ก๋ฉํฉ๋๋ค.readNetFromDarket(config ํ์ผ, w..
๐ Computer Vision
2024.07.14
YOLO (You Only Look Once) YOLO(You Only Look Once)์ ์ค์๊ฐ ๊ฐ์ฒด ํ์ง ์์คํ
์ผ๋ก, ์ด๋ฏธ์ง๋ ๋น๋์ค์์ ์ฌ๋ฌ ๊ฐ์ฒด๋ฅผ ๋์์ ํ์งํ๊ณ ๋ถ๋ฅํ๋ ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ์ ์๊ณ ๋ฆฌ์ฆ์
๋๋ค. YOLO: Real-Time Object DetectionYOLO: Real-Time Object Detection You only look once (YOLO) is a state-of-the-art, real-time object detection system. On a Pascal Titan X it processes images at 30 FPS and has a mAP of 57.9% on COCO test-dev. Comparison to Other Detectors YOLOv3 is ..
๐ Computer Vision
2024.07.10
Tensorflow์์ Pretrained ๋ ๋ชจ๋ธ ํ์ผ์ OpenCV์์ ๋ก๋ํ์ฌ ์ด๋ฏธ์ง์ ์์์ ๋ํ Object Detection์ ์ํํด ๋ณด๊ฒ ์ต๋๋ค.์
๋ ฅ ์ด๋ฏธ์ง๋ก ์ฌ์ฉ๋ ์ด๋ฏธ์ง ๋ณด๊ธฐimport cv2import matplotlib.pyplot as plt%matplotlib inlineimg = cv2.imread('../../data/image/beatles01.jpg')img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)print('image shape:', img.shape)plt.figure(figsize=(12, 12))plt.imshow(img_rgb)image shape: (633, 806, 3)Inference ๋ชจ๋ธ ์์ฑTensorflow์์ Pretr..
๐ Computer Vision
2024.07.07
Object Detection Historyํฌ๊ฒ 3๊ฐ์ ๋ถ๋ฅ๋ก ๋๋ ๋ณด๊ฒ ์ต๋๋ค.1. ์ ํต์ ์ธ ํ์ง ๋ฐฉ๋ฒ (Traditional Detection Methods)VJ Detector (P. Viola et al., 2001):๋น์ฌ๋ผ-์กด์ค ๊ฐ์ฒด ํ์ง๊ธฐ๋ผ๊ณ ๋ ๋ถ๋ฆฌ๋ ์ด ๋ฐฉ๋ฒ์ ํน์ง ๊ธฐ๋ฐ ์ผ๊ตด ํ์ง๋ฅผ ์ํ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ๋๋ฆฌ ์๋ ค์ ธ ์์ต๋๋ค.HOG Detector (N. Dalal et al., 2005):Histogram of Oriented Gradients (HOG)๋ ์ด๋ฏธ์ง์ ๊ตญ์์ ์ธ ๋ฐฉํฅ ์ ๋ณด๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐ์ฒด๋ฅผ ํ์งํ๋ ๋ฐฉ๋ฒ์
๋๋ค.DPM (P. Felzenszwalb et al., 2008):Deformable Part Model (DPM)์ ๋ฌผ์ฒด๋ฅผ ์์ ๋ถ๋ถ๋ค๋ก ๋ถํ ํ์ฌ ๊ฐ ๋ถ๋ถ์ ์์น์ ํํ๋ฅผ ๋ชจ๋ธ๋งํ..
๐ Computer Vision
2024.06.04
OpenCV DNN ํจํค์ง๋ฅผ ์ด์ฉํ์ฌ SSD๊ธฐ๋ฐ Object Detection ์ํ Tensorflow ์์ Pretrained ๋ ๋ชจ๋ธ ํ์ผ์ OpenCV์์ ๋ก๋ํ์ฌ ์ด๋ฏธ์ง์ ์์์ ๋ํ Object Detection์ ์ํํด๋ณด๊ฒ ์ต๋๋ค.์
๋ ฅ ์ด๋ฏธ์ง๋ก ์ฌ์ฉ๋ ์ด๋ฏธ์ง ๋ณด๊ธฐimport cv2import matplotlib.pyplot as plt%matplotlib inlineimg = cv2.imread('../../data/image/beatles01.jpg')img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)print('image shape:', img.shape)plt.figure(figsize=(12, 12))plt.imshow(img_rgb)Tensorflow์์..
๐ Computer Vision
2024.06.02
OpenCV DNN ์ฅ๋จ์ OpenCV Deep Neural Network์ ์ฅ๋จ์ ์ ๋ฐํ์ฌ ์์๋ณด๊ฒ ์ต๋๋ค.OpenCV ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ Intel์ ์ํ์ฌ ์ต์ด ๊ฐ๋ฐ ๋์์ต๋๋ค. ์ฅ๋จ์ ์ ์ค๋ช
ํด๋ณด๊ฒ ์ต๋๋ค.OpenCV DNN ์ฅ์ ๋ฅ๋ฌ๋ ๊ฐ๋ฐ ํ๋ ์ ์ํฌ ์์ด ์ฝ๊ฒ Inference๋ฅผ ๊ตฌํ ๊ฐ๋ฅ ํฉ๋๋ค.OpenCV์์ ์ง์ํ๋ ๋ค์ํ Computer Vision ์ฒ๋ฆฌ ๋ฐ API์ Deep learning์ ์ฝ๊ฒ ๊ฒฐํฉํ ์ ์๋ค๋ ํน์ง์ด ์์ต๋๋ค.OpenCV DNN ๋จ์ GPU ์ง์ ๊ธฐ๋ฅ์ด ์ฝํฉ๋๋ค.DNN ๋ชจ๋์ ๊ณผ๊ฑฐ์ NVIDIA GPU ์ง์์ด ๋์ง ์์์ต๋๋ค. 2019๋
10์์ Google์์ NVIDIA GPU ์ง์ ๋ฐํํ์ง๋ง. ์์ง ํ๊ฒฝ ๊ตฌ์ฑ/์ค์น๊ฐ ์ด๋ ต์ต๋๋ค. ์ ์ฐจ ๊ฐ์ ์์
์ด ์งํ์ค์
๋๋ค.OpenCV๋ ..
๐ Computer Vision
2024.05.29
Faster R-CNNFaster R-CNN์ R-CNN ๊ณ์ด์ Object Detection ๋ชจ๋ธ ์ค์์ ๊ฐ์ฅ ์ง๋ณด๋ ๋ชจ๋ธ ์ค ํ๋๋ก, Object Detection ์์ ๋งค์ฐ ๋์ ์ ํ๋์ ํจ์จ์ฑ์ ์ ๊ณตํฉ๋๋ค.๋ํ Region Proposal Network (RPN)๋ฅผ ๋์
ํ์ฌ ์ ์ฒด ์์คํ
์ ์๋์ ์ ํ๋๋ฅผ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค.Faster R-CNN์ RPN(Region Proposal Network) + Fast R-CNN์ด ํฉ์ณ์ง ๋ชจ๋ธ์
๋๋ค.๊ธฐ์กด Selective Search๊ฐ ์ํํ๋ Object ์์น์ Bounding Box๋ฅผ ๊ทธ๋ ค์ ์ถ์ฒํฉ๋๋ค. (GPU ์ฌ์ฉ)๋ํ Region Proposal Network๋ฅผ ์ฌ์ฉํฉ๋๋ค. (Selective Search ์ญํ )๊ทธ๋ฆฌ๊ณ Network๋ก๋ง ๊ตฌ์ฑ์ด ๋..
๐ Computer Vision
2024.05.27
Fast R-CNN ๊ฐ์ FAST R-CNN์ R-CNN (Region-based Convolutional Neural Network)๊ณผ SPP-Net (Spatial Pyramid Pooling Network)์ ๋จ์ ์ ๋ณด์ํ๊ณ , ๊ฐ์ฒด ํ์ง์ ์๋์ ์ ํ์ฑ์ ํฌ๊ฒ ๊ฐ์ ํ ๋ชจ๋ธ์
๋๋ค Fast R-CNN์ ์ด๋ฌํ ์์๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค.์
๋ ฅ ์ด๋ฏธ์ง: ์๋ณธ ์ด๋ฏธ์ง์ Region Proposal์ด ์
๋ ฅ๋ฉ๋๋ค.๊ณตํต CNN: ์ด๋ฏธ์ง์์ Feature Map(ํน์ง ๋งต)์ ์ถ์ถํฉ๋๋ค.RoI Pooling Layer: ๊ฐ Region Proposal์ ๊ณ ์ ๋ ํฌ๊ธฐ์ *Feature Map(ํน์ง ๋งต)์ผ๋ก ๋ณํํฉ๋๋ค.์์ ์ฐ๊ฒฐ ์ธต: ๊ณ ์ ๋ ํฌ๊ธฐ์ *Feature Map(ํน์ง ๋งต)์ ์
๋ ฅ์ผ๋ก ๋ฐ์ Classificatio..
๐ Computer Vision
2024.05.25
SPPNet - Spatial Pyramid Pooling Net์ด๋ฒ์๋ SPPNet - Spatial Pyramid Pooling Net์ ๋ฐํ์ฌ ์์๋ณด๊ณ ์ SPPNet์ด ๋ฑ์ฅํ๋์ง ํ๋ฒ ์์ ๋ณด๊ฒ ์ต๋๋ค. RCNN ์ฃผ์ ๋ฌธ์ ์ ๊ทธ์ ์ RCNN์ ์ฃผ์ ๋ฌธ์ ์ ์ ๋ฐํ์ฌ ํ๋ฒ ์์๋ณด๊ฒ ์ต๋๋ค.์ผ๋จ, CNN์ 2,000๊ฐ์ Region ์์ญ ์ด๋ฏธ์ง๊ฐ CNN์ผ๋ก ์
๋ ฅ ๋๋ฉด์ Object Detection ์ํ์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆฝ๋๋ค.์ด์ ๋ ์์ ๊ทธ๋ฆผ์ ๋ณด๋ฉด ์ ์ ์๋ฏ์ด 2,000๊ฐ์ Region ์์ญ์ด Proposal ๋์ด์ผ ํฉ๋๋ค.๊ทธ๋ฌ๋ฉด Feature Map์ด 2,000๊ฐ๊ฐ ๋ง๋ค์ด ์ ์ผ ํฉ๋๋ค. ์ด๋ก ์ธํด์ ๋จพ์ ์ฐ์ฐ์ด ํ์ํ๋ฉฐ ์ฒ๋ฆฌ ์๊ฐ์ด ๊ธธ์ด์ง๋๋ค.๋ํ Region ์์ญ ์ด๋ฏธ์ง๊ฐ ๊ณ ์ ๋ ํฌ๊ธฐ๋ก Crop / W..
๐ Computer Vision
2024.05.22
์ด๋ฒ ๊ธ์์๋ Object Detection Network ๊ตฌ์กฐ ๊ฐ์, FPS, Resolution๊ณผ ์ฑ๋ฅ ์๊ด ๊ด๊ณ, R-CNN ์ ๋ฐํ์ฌ ์์ ๋ณด๊ฒ ์ต๋๋ค. Object Detection Network ๊ฐ์Object Detetction Network ๊ตฌ์กฐ๋ ๋ ๋ถ๋ถ์ผ๋ก ๋๋ ์ ์์ต๋๋ค:ํน์ง ์ถ์ถ ๋คํธ์ํฌ(Feature Extractor Network)์ ๊ฐ์ฒด ํ์ง ๋คํธ์ํฌ(Object Detection Network)์
๋๋ค.๋ ๋คํธ์ํฌ๋ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ํน์ ์์
์ ๋ง๊ฒ ๋ฏธ์ธ ์กฐ์ ๋ฉ๋๋ค. Feature Extractor Network (ํน์ง ์ถ์ถ ๋คํธ์ํฌ)์
๋ ฅ ์ด๋ฏธ์ง์์ ์ ์ฉํ ํน์ง์ ์ถ์ถํฉ๋๋ค.VGG, ResNet, Inception ๋ฑ๊ณผ ๊ฐ์ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ฉฐ, ๋ณดํต Ima..