본문 바로가기

Data-science/deep learning

object detection 공부

반응형

object localization vs object detection

 - localization은 이미지 당 하나의 object에 대해 bounding box를 얻는 문제


- 2 stage Object Detector

   - Region proposal / detection 순차적으로 수행하는 방법

   - 1 stage에 비해 비교적 느리지만 정확하다

   - Region proposal -> classification -> multi-class classification, bounding box regression 

   - Fast R-CNN, Faster R-CNN

-  1 stage Object Detector

   - 두 가지 과정을 한번에 처리하는 방법론

   - Conv Layers -> Feature Maps -> multi-class classification, bounding box regression 

   - 2 stage에 비해 빠르지만 부정확하다.   

   - SSD ( DSSD, DSOD, RetinaNet...)

   - YOLO (1,2,3)


- Object detection 적용 사례

- 자동차 (ADAS - Advanced Driver Assistance System), 미검의 최소화

- Embedded Device에 수행이 되어야하기 때문에 연산량이 큰 모델은 어려움

- CCTV Surveillance (CCTV 감시)

- 이상 현상 감지의 전처리 역할로 사용 가능

- OCR(Optical Character Recognition, 이미지에서 글자를 인식하여 출력하는 것)

- Aerial Image 분석 (항공 이미지)

- 신체 인식 -> 얼굴 인식 (감정 분석, 스마트폰 잠금 화면 해제 등)

- 제조업 - Vision Inspection (미검이 중요)

- 스포츠 경기 분석

- 무인 점포 (일일이 바코드를 찍는 대신 가판대 위에 물건을 올려 두면 자동으로 인식 및 계산, Amazon Go)


- Object Detection의 성능

- 정확도 :  모델이 GT와 유사한 bounding box를 예측(regression)하면서 동시에 Box 안의 object의 class를 잘 예측하는 것을 의미, ( class를 올바르게 예측했을 때 bounding box의 정확도를 기준으로 측정 )

- IOU (Intersection Over Union) (교집합/합집합)

- 일반적으로 IOU가 0.5를 넘으면 정답이라고 생각

- Precision

- 주로 Recall과 사용, TP / (TP + FP)

- Recall

- TP / (TP + FN), Recall을 높이기 위해선 되도록 Box를 많이 쳐서 정답을 많이 맞춰 FN을 줄여야 함.

- precision과 recall은 반비례, 두 값이 모두 높은 모델이 좋은 모델

- AP (Average Precision), mAP (mean Average Precision)

- AP

- Recall을 0부터 0.1단위로 1까지 증가시킬 때 나오는 precision 값들의 평균을 의미

- 하나의 class마다 하나의 AP값을 계산

- mAP

- 전체 Class에 대해 AP를 계산하여 평균을 낸 값

- FPS (Frame Per Second)

- 초당 몇 장의 이미지가 처리 가능한지를 나타냄

- 2018/11 -> RefineDet

- 2019/1 -> M2Det

    




ref)https://hoya012.github.io/blog/Tutorials-of-Object-Detection-Using-Deep-Learning-the-application-of-object-detection/

반응형