'👀 Computer Vision' 카테고리의 글 목록 (2 Page)

[CV] OpenCV로 Object Detection 구현하기 (Part.1)

2024.06.02

OpenCV DNN 장단점OpenCV Deep Neural Network의 장단점에 데하여 알아보겠습니다.OpenCV 라이브러리는 Intel에 의하여 최초 개발 되었습니다. 장단점을 설명해보겠습니다.OpenCV DNN 장점딥러닝 개발 프레임 워크 없이 쉽게 Inference를 구현 가능 합니다.OpenCV에서 지원하는 다양한 Computer Vision 처리 및 API와 Deep learning을 쉽게 결합할 수 있다는 특징이 있습니다.OpenCV DNN 단점GPU 지원 기능이 약합니다.DNN 모듈은 과거에 NVIDIA GPU 지원이 되지 않았습니다. 2019년 10월에 Google에서 NVIDIA GPU 지원 발표했지만. 아직 환경 구성/설치가 어렵습니다. 점차 개선 작업이 진행중입니다.OpenCV는 ..

👀 Computer Vision

[CV] Faster R-CNN (Faster Region-based Convolutional Neural Network)

2024.05.29

Faster R-CNNFaster R-CNN은 R-CNN 계열의 Object Detection 모델 중에서 가장 진보된 모델 중 하나로, Object Detection 에서 매우 높은 정확도와 효율성을 제공합니다.또한 Region Proposal Network (RPN)를 도입하여 전체 시스템의 속도와 정확도를 크게 향상시켰습니다.Faster R-CNN은 RPN(Region Proposal Network) + Fast R-CNN이 합쳐진 모델입니다.기존 Selective Search가 수행하던 Object 위치에 Bounding Box를 그려서 추천합니다. (GPU 사용)또한 Region Proposal Network를 사용합니다. (Selective Search 역할)그리고 Network로만 구성이 되..

👀 Computer Vision

[CV] Fast R-CNN (Fast Region-based Convolutional Neural Network)

2024.05.27

Fast R-CNN 개요 FAST R-CNN은 R-CNN (Region-based Convolutional Neural Network)과 SPP-Net (Spatial Pyramid Pooling Network)의 단점을 보완하고, 객체 탐지의 속도와 정확성을 크게 개선한 모델입니다 Fast R-CNN은 이러한 요소로 구성되어 있습니다.입력 이미지: 원본 이미지와 Region Proposal이 입력됩니다.공통 CNN: 이미지에서 Feature Map(특징 맵)을 추출합니다.RoI Pooling Layer: 각 Region Proposal을 고정된 크기의 *Feature Map(특징 맵)으로 변환합니다.완전 연결 층: 고정된 크기의 *Feature Map(특징 맵)을 입력으로 받아 Classificatio..

👀 Computer Vision

[CV] SPPNet - Spatial Pyramid Pooling Net

2024.05.25

SPPNet - Spatial Pyramid Pooling Net이번에는 SPPNet - Spatial Pyramid Pooling Net에 데하여 알아보고 왜 SPPNet이 등장했는지 한번 알아 보겠습니다. RCNN 주요 문제점그전에 RCNN의 주요 문제점에 데하여 한번 알아보겠습니다.일단, CNN은 2,000개의 Region 영역 이미지가 CNN으로 입력 되면서 Object Detection 수행시간이 오래 걸립니다.이유는 위의 그림을 보면 알 수 있듯이 2,000개의 Region 영역이 Proposal 되어야 합니다.그러면 Feature Map이 2,000개가 만들어 저야 합니다. 이로 인해서 먾은 연산이 필요하며 처리 시간이 길어집니다.또한 Region 영역 이미지가 고정된 크기로 Crop / W..

👀 Computer Vision

[CV] Object Detection Network 구조, R-CNN 개요

2024.05.22

이번 글에서는 Object Detection Network 구조 개요, FPS, Resolution과 성능 상관 관계, R-CNN 에 데하여 알아 보겠습니다. Object Detection Network 개요Object Detetction Network 구조는 두 부분으로 나눌 수 있습니다:특징 추출 네트워크(Feature Extractor Network)와 객체 탐지 네트워크(Object Detection Network)입니다.두 네트워크는 일반적으로 사전 학습된 모델을 사용하여 특정 작업에 맞게 미세 조정됩니다. Feature Extractor Network (특징 추출 네트워크)입력 이미지에서 유용한 특징을 추출합니다.VGG, ResNet, Inception 등과 같은 모델을 사용하며, 보통 Ima..

👀 Computer Vision

[CV] Object Detection & Segmentation을 위한 패키지 & CUDA 소개

2024.05.20

Object Detection & Segmentation을 위한 다양한 패키지들Object Detection & Segmentation을 위한 다양한 패키지들이 있습니다.Keras와 Tensorflow 기반의 다양한 오픈소스 패키지들쉬운 활용과 Customization 가능한 장점이 있습니다.다만 Object Detection 알고리즘 별로 서로 다른 패키지들을 적용해야 하는 단점이 있습니다.OpenCV 의 DNN(Deep Neural Network) 모듈간편하게 Object Detection Inference가 가능합니다.다만 학습이 불가능하며 주로 CPU 위주로 GPU 활용이 어렵다는 점이 있습니다.Tensorflow Object Detection API가장 많은 Detection 알고리즘에 적용이 ..

👀 Computer Vision

[CV] OpenCV 영상처리 개요

2024.05.19

OpenCV 영상 처리 개요한번 OpenCV의 영상처리 방법에 데하여 알아보겠습니다.OpenCV의 VideoCapture클래스는 동영상을 개별 Frame으로 하나씩 읽어(Read)들이는 기능을 제공합니다.VideoWriter는 VideoCapture로 읽어들인 개별 Frame을 동영상 파일로 Write를 수행합니다.VideoCapture.read() - 영상의 다음 Frame을 읽습니다.VideoWriter.write() - 영상의 Frame을 write 합니다.cap = cv2.VideoCapture(video_input_path)…………vid_writer = cv2.VideoWriter(video_output_path, …..)while True:hasFrame, img_frame = cap.read..

👀 Computer Vision

[CV] OpenCV 개요

2024.05.18

Python 기반 주요 이미지 라이브러리크게 3가지가 있습니다.PIL (Python Image Library)주로 이미지 처리만을 위해 사용합니다.처리 성능이 상대적으로 느리다는 단점이 있습니다.Scikit-Image파이썬 기반의 전반적인 컴퓨터 비전 기능 입니다.사이파이(Scipy)에 기반하고 있습니다.OpenCV오픈소스 기반의 최고 인기 컴퓨터 비전 라이브러리 입니다.컴퓨터 비전 기능 일반화에 크게 기여 했다는 특징이 있습니다.(어려운 기능도 API 몇줄로 간단하게 구현이 가능합니다.)C++ 기반이나 Python도 지원합니다. (Java, C# 등 다양한 언어 지원) OpenCV 특징OpenCV (Open Source Computer Vision Library)는 컴퓨터 비전과 머신 러닝을 위한 오픈..

👀 Computer Vision

[CV] Object Detection & Segmentation을 위한 주요 Dataset

2024.05.17

주요 Dataset많은 Detection & Segmentation DL 패키지가 아래의 Dataset들을 기반으로 Pretrained 되어 배포되었습니다.PASCAL VOC: XML Format, 20개의 Object CategoryBounding Box 양식으로 구성되어 있습니다(XML), 그리고 하나의 Image에 데하여 Annotation 합니다. MS COCO: json Form, 80개의 오브젝트 카테고리Google Open Images: csv Format, 600개의 오브젝트 카테고리 PASCAL VOC 2012PASCAL VOC(Pattern Analysis, Statistical Modelling and Computational Learning Visual Object Classes)..

👀 Computer Vision

[CV] Precision(정밀도) & Recall(재현율)

2024.05.15

Precision(정밀도) & Recall(재현율)정밀도(Precision)과 재현율(Recall)은 주로 Binary Classification(이진 분류)에서 사용되는 성능지표 입니다.정밀도(Precision)는 예측을 Positive로 한 대상 중에 예측과 실제 값이 Positive로 일치한 데이터의 비율을 뜻합니다.Object Detection에서는 검출 알고리즘이 검출 예측한 결과가 실제 Object들과 얼마나 일치하는지를 나타내는 지표입니다.재현율(Recall)은 실제 값이 Positive인 대상 중에 예측과 실제 값이 Positive로 일치한 데이터의 비율을 뜻합니다. ObjectDetection에서는 검출 알고리즘이 실제 Object들을 빠뜨리지 않고 얼마나 정확히 검출 예측하는지를 나타내..

티스토리툴바