- ์ง๋ ๊ต์: ์ด๋ํธ
- ํ์:
์ํํธ์จ์ด์ตํฉํ๊ณผ ๊ตฌํ์ 2018102091 (PM)
์ํํธ์จ์ด์ตํฉํ๊ณผ ๊น๋ฏผํ 2019102081
์ํํธ์จ์ด์ตํฉํ๊ณผ ์ด์ ์ 2020110480
[์กฐ๋ฅ ์ถฉ๋]
์ฐ๋ฆฌ ๋ง๋ก '์กฐ๋ฅ ์ถฉ๋'์ด๋ผ๊ณ ๋ถ๋ฆฌ๋ '๋ฒ๋ ์คํธ๋ผ์ดํฌ(Bird Strike)'๋ ์กฐ๋ฅ๊ฐ ๋นํ๊ธฐ์ ๋ถ๋ชํ๊ฑฐ๋ ์์ง ์์ ๋นจ๋ ค ๋ค์ด๊ฐ๋ ํ์์ ๋งํ๋ค. ์ฃผ๋ก ๊ณตํญ ๋ถ๊ทผ, ๊ทธ๋ฆฌ๊ณ ์ด์ฐฉ๋ฅ ์ ์ฃผ๋ก ๋ฐ์ํ๋๋ฐ, ์ฐ๋ฆฌ๋๋ผ์์๋ ์กฐ๋ฅ์ถฉ๋ ์ฌ๊ณ ๊ฐ ๋งค๋
100~200๊ฑด ์ด์ ๋ฐ์ ํ๊ณ ์์ผ๋ฉฐ ์ง๋ํด ๋ฏธ๊ตญ ์ฐ๋ฐฉํญ๊ณต์ฒญ์์๋ 1๋ง 7์ฒ ๊ฑด์ด ๋๋ ์ ๊ณ ๊ฐ ์ ์ ๋์๋ค. ์ค์ ๋ก 1.8kg์ ์๊ฐ ์์ 960km๋ก ๋นํํ๋ ํญ๊ณต๊ธฐ์ ๋ถ๋ช์น๋ฉด 64t ๋ฌด๊ฒ์ ์ถฉ๊ฒฉ์ด ๋ฐ์ํ๋ฉฐ, ์ ์ธ๊ณ์ ํผํด๊ท๋ชจ๋ ์ฐ๊ฐ ์ฝ 1์กฐ์์ผ๋ก ์ถ์ ๋๋ค. ์ต๊ทผ 5๋
๊ฐ ํญ๊ณต๊ธฐ-์กฐ๋ฅ๊ฐ ์ถฉ๋์ ์ฃผ๋ก ๊ณตํญ๊ตฌ์ญ์์ ๋ฐ์ํ๊ณ ์์ผ๋ฉฐ, ์ด๋ฅผ ์๋ฐฉํ๊ธฐ ์ํด ๊ณตํญ์์๋ ์ฌ๊ฒฉํ ์ด์, ์ฒ์ ๋ฅ ์ฌ์ก์ ํตํด ๋
ธ๋ ฅํ๊ณ ์์ง๋ง ํจ๊ณผ๊ฐ ๋ฏธ๋นํ ์ํฉ์ด๋ค. ๊ทธ๋์ ๋ณธํ์ ์ต์ ์์ญ๋ช
์์ ๋ง๊ฒ๋ ์๋ฐฑ๋ช
์ด์์ ์ฌ๋ง์๋ฅผ ๋ฐ์์ํค๋ ๋ฒ๋ ์คํธ๋ผ์ดํฌ ๋ฐฉ์ง๋ฅผ ์ํด Faster-RCNN, YOLOF, SSD ๊ธฐ๋ฐ์ ์กฐ๋ฅ๋ฅผ ์ค์๊ฐ์ผ๋ก Detection ํ๋ ๋ชจ๋ธ์ ํ์ต์ ํตํด ๊ตฌ์ถํ์ฌ ๋ค์ํ ๊ธฐ์ ํ๊ฒฝ์์ ๋นํ์ค์ธ ์๊ณต๋ฌผ์ฒด(์กฐ๋ฅ)๋ฅผ ์ค์๊ฐ์ผ๋ก ํ์งํ ๊ฒ์ด๋ฉฐ, ๋ํ Detection ๋ชจ๋ธ๊ณผ ReID ๋ชจ๋ธ์ ๊ฒฐํฉํ์ฌ DeepSORT ๋ชจ๋ธ์ ๊ตฌ์ถํ ๋ค ์ค์๊ฐ์ผ๋ก ์๊ณต ๋ฌผ์ฒด(์กฐ๋ฅ)๋ฅผ ์ถ์ ํ ๊ฒ์ด๋ค.
[์ ์ฑ๊ตญ ๋ฌด์ธ ํญ๊ณต๊ธฐ์ ์๊ณต ์นจ๋ฒ]
์ต๊ทผ ๋ถํ์ ๋ฌด์ธ ํญ๊ณต๊ธฐ์ ์๊ณต ์นจ์
์ด ๋ฌธ์ ๋ก ๋ ์ค๋ฅด๊ณ ์๋ค. ์ ์ ๊ณ ์ ์ต๊ธฐ์ ํ์ ์ต๊ธฐ, ์ค๋ํ ๋ฌด์ธ๊ธฐ์ ๊ฒฝ์ฐ ํ์ง ๋ฐ ์๋ณ์ด ์ฝ๊ณ , ๊ธ๋ฐฉ ๊ฒฉ์ถ์ ๋์คํ
์ง๋ง ๋ถํ์ด ๋ด์ธ์ฐ๋ ์ํ ๋ฌด์ธ๊ธฐ๋ค์ ๊ฒฝ์ฐ ์ด์ผ๊ธฐ๊ฐ ๋ค๋ฅด๋ค. ์ฒ ์๋ ํ์ ๊ฐ์ ์์ ๋๋ฌผ์ด๋ ๋ฌผ์ฒด๋ค ์กฐ์ฐจ ๋ฏธํ์ธ ํญ์ ์ผ๋ก ํ์ง๋๋ ์ํฉ์์ ์์ ๋ถ๋๊ฐ ํญ์ ์๋ณ์ ๋์๋๋ผ ์๊ฐ์ด ์์๋ ์ ๋ฐ์ ์๋๋ฐ, ๋ณธํ์ ํด๋น ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ฌด์ธ ํญ๊ณต๊ธฐ ํ์ต ์ด๋ฏธ์ง ๋ฐ์ดํฐ์
, ํ
์คํธ ์ด๋ฏธ์ง ๋ฐ์ดํฐ์
์ ์์งํ์ฌ ๋ฒ๋์คํธ๋ผ์ดํฌ ๋ฐฉ์ง๋ฅผ ์ํ ๋ชจ๋ธ์ ์ ์ดํ์ต(Transfer Learning)์ ์ถ๊ฐ๋ก ์งํํ ์์ ์ด๋ค.
- 3๊ฐ์ Object Detection Model(Faster-RCNN, YOLOF, SSD) Training & Evaluation & Visualization & Inference ๋ฐ ์ฑ๋ฅ ์ต์ ํ ์ํ
- DeepSORT์ ๋ํ Detection Model Training, Evaluation & ReID Model Training, Evaluation
- ReID Model์ ์ฌ์ฉํ DeepSORT Model๊ณผ ReID Model์ ์ฌ์ฉํ์ง ์์ DeepSORT Model ๊ฐ์ ์ฑ๋ฅ ๋น๊ต
MMdetection: https://github.com/open-mmlab/mmdetection
MMtracking: https://github.com/open-mmlab/mmtracking
Faster-RCNN
Backbone: ResNet50
Neck: FPN
RPN_head: RPNHead
Classification Loss: CE(Cross Entropy) Loss
Bounding Box Regression Loss: L1 Loss
YOLOF
Backbone: ResNet
Neck: DilatedEncoder
BBox_head: YOLOFHead
Classification Loss: Focal Loss
Bounding Box Regression Loss: GIoU Loss
SSD
Backbone: ResNet
Neck: SSDNeck
BBox_head: SSDHead
Classification Loss: Localization Loss
Bounding Box Regression Loss: IoU Loss
[๊ณตํต Spec]
Framework: MMDetection
Learning_rate=0.02 / 8
Workers_per_gpu: 4
Batch_size: 16
Epochs: 100
Classes = ('Bird', 'Airplane', 'Helicopter', 'FighterPlane', 'Paraglidingโ , 'Droneโ)
Visualization Tool: Tensorboard, Matplotlib
[Runtime Environment]
Sys.platform: linux
Python: 3.10.13 (main, Sep 11 2023, 13:44:35) [GCC 11.2.0]
CUDA available: True
GPU 0: NVIDIA GeForce RTX 3090
CUDA_HOME: /usr/local/cuda
NVCC: Cuda compilation tools, release 11.7, V11.7.99
GCC: gcc (Ubuntu 9.4.0-1ubuntu1~20.04.2) 9.4.0
PyTorch: 1.13.0+cu116
PyTorch compiling details: PyTorch built with:(- GCC 9.3, - C++ Version: 201402,- Intel(R) 64
architecture applications)
https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=476
AI-Hub์ Small object detection์ ์ํ ์ด๋ฏธ์ง ๋ฐ์ดํฐ์ ์ ์ด์ฉํ์๋ค. ํด๋น ๋ฐ์ดํฐ ์ ์์๋ ์ด๋ฏธ์ง(2800x2100 ํด์๋) ๋ด์ ์ผ์ ํฌ๊ธฐ ์ดํ์ ์ํ ๊ฐ์ฒด(200x200 ํฝ์ ํฌ๊ธฐ ์ดํ)๋ค๋ง ์กด์ฌํ๋ฉฐ ์ด๋ฏธ์ง์ ๋ํ JSON ํํ์ ์ด๋ ธํ ์ด์ ํ์ผ ๋ํ ํฌํจํ๊ณ ์๋ค.
- Type: AircraftDataset (Classes: "Bird", "Airplane", "Helicopter", "FighterPlane", "Paragliding", "Drone")
- Train Datasets: 5760
- Validation Datasets: 1601
- Test Datasets: 640
์ถ๊ฐ๋ก ๋ค์ํ ํ๊ฒฝ์์์ ๊ฐ์ฒด ํ์ง์จ์ ๋์ด๊ธฐ ์ํด ํ์ต ๊ณผ์ ์ค ์๋์ ๊ฐ์ Data Augmentation ๊ธฐ๋ฒ๋ค์ ์ ์ฉํ์๋ค. ํ์ง๋ง MMDetection์ ํ์ดํ๋ผ์ธ ๋ด๋ถ์์ ๋ชจ๋ธ์ ํ์ต๊ณผ ํ๊ฐ๊ฐ ์ด๋ฃจ์ด์ง๊ธฐ ๋๋ฌธ์ Augmentation์ด ์ ์ฉ ๋ ์ดํ์ ์ ํํ Datasets์ Size๋ฅผ ์๋ณํ๊ธฐ ๋ถ๊ฐ๋ฅํ๋ค๋ Issue๊ฐ ์กด์ฌํ์๋ค.
- Brightness Distortion (์ด๋ฏธ์ง์ ๋ช
๋ ๋ณ๊ฒฝ)
โ brightness_delta=32
โ ์ต์๊ฐ๊ณผ ์ต๋๊ฐ์ด ๊ฐ๊ฐ -32, 32์ธ ๊ท ์ผ ๋ถํฌ ํจ์์ Output์ ํตํด ์ด๋ฏธ์ง์ ๋ช ๋๋ฅผ ๋ณํ ํ์๋ค. - Contrast Distortion (์ด๋ฏธ์ง์ ๋๋น ๋ณ๊ฒฝ)
โ contrast_range=(0.5, 1.5)
โ์ต์๊ฐ๊ณผ ์ต๋๊ฐ์ด ๊ฐ๊ฐ 0.5, 1.5์ธ ๊ท ์ผ๋ถํฌํจ์์ Output์ ํตํด ์ด์ฉํด ์ด๋ฏธ์ง์ ๋๋น๋ฅผ ๋ณํ ํ์๋ค. Contras Distortion์ Brightness Distortion๊ณผ๋ ๋ค๋ฅด๊ฒ Sum์ด ์๋ Multiplication ์ฐ์ฐ์ ์ํํ์ฌ Pixel Intensity์ ๋๋น๋ฅผ ์ฆ๊ฐ์ํจ๋ค - Saturation Distortion (์ด๋ฏธ์ง์ ์ฑ๋ ๋ณ๊ฒฝ)
โ saturation_range=(0.5, 1.5)
โ ์ต์๊ฐ๊ณผ ์ต๋๊ฐ์ด ๊ฐ๊ฐ 0.5, 1.5์ธ ๊ท ์ผ ๋ถํฌ ํจ์์ Output์ ํตํด ์ด๋ฏธ์ง์ ์ฑ๋๋ฅผ ๋ณํ ํ์๋ค, H(Hue; ์์กฐ), S(Saturation; ์ฑ๋), V(Value; ๋ช ๋)์์ 1์ ์ธ๋ฑ์ค๋ฅผ ๊ฐ๋ S๋ฅผ ๋ณ๊ฒฝ - Hue Distortion (์ด๋ฏธ์ง์ ์์ ๋ณ๊ฒฝ)
โ hue_delta=18 - Resize (์ด๋ฏธ์ง์ ์ฌ์ด์ฆ ๋ณ๊ฒฝ)
โ img_scale=(1333, 800) - RandomFlip (์ด๋ฏธ์ง ํ์ )
โ flip_ratio=0.5 - Normalize (Pixel Intensity Normalization)
Faster-RCNN Learning Rate
Faster-RCNN Accuracy & Train_loss
Faster_RCNN mAP
YOLOF Learning Rate
YOLOF Train_loss
YOLOF mAP
Detector์ ReID Model ํ์ต ์ํ์ ์ํด ๋์คํ๋ MOT datasets์ ๋ณดํ์๋ ์ฐจ๋ class๊ฐ ์๋ Bird class๋ฅผ ์ํ Custom Datasets์ ๊ตฌ์ถํด์ผ ํ๋ค.๋ฐ๋ผ์ CVAT Tool์ ์ด์ฉํ์ฌ Track Rectangle๋ก ๊ฐ๊ฐ์ ๊ฐ์ฒด๋ฅผ ์ง์ ํ ๋ค์ Frame๋ง๋ค ์์๋ฅผ ์ด๋์์ผ ์ถ์ ์ขํ๋ฅผ ์ ์ฅํ๊ณ ๊ฐ์ฒด๊ฐ ํ๋ฉด์์ ์ฌ๋ผ์ง์ Switch OFF์์ผ Ground Truth ํ์ผ์ ์ฐ์ถํ๋ค.gt.txt๋ ์ฐจ๋ก๋ก Frame number,Identity number,Bonding box left,Bounding box top,Bounding box width,Bounding box height,,Class,Visibility์์ด๋ค.Train Dataset์ Video๋ฅผ Frame Per Second ๋จ์๋ก ๋ถํ ๋ค ์ ์ฅํ์๋ค.์ต์ข ์ผ๋ก MMtracking์ mot2coco.py,mot2reid.py ํ์ผ์ ์ด์ฉํด MOTํ์์ COCO Format Annotation๊ณผ Bounding Box Image๋ก ๊ตฌ์ฑ๋์ด ์๋ ReID Datasets์ผ๋ก ๋ณํํ์ฌ Multi Object Tracking Datasets์ ๊ตฌ์ถํ์๋ค.
MMTracking์์ ์ ๊ณตํ๋ DeepSORT์ ๊ฒฝ์ฐ Object Detection Model ๊ณผ ReID Model์ ํผํฉํ์ฌ MOT์ ์ํํ ์ ์์๋ค. Detection Model์ ๊ฒฝ์ฐ ๋ณธ ํ์ด ๊ตฌ์ถํ Faster-RCNN, YOLOF, SSD์ Checkpoint ํ์ผ์ Tracking Video์ ๋ํ ์ ์ด ํ์ต(Epochs: 10, Step: 10, Batch Size: 2, # of Training Datasets: 216)์ ์ํํ ๋ค ์ ์ฉํ์๋ค. ReID(Re-Identification) Model์ ๊ฒฝ์ฐ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์ ์ ๊ฐ์ฒด ๊ฐ์ ๊ตฌ๋ณ๋๋ ํน์ง์ด ์๋ ๊ฒฝ์ฐ, ๊ฐ์ฒด์ ์๋ณ์ด ์ด๋ ค์์ง๊ณ ์ฑ๋ฅ์ด ์ ํ๋ ์ ์๋ค. ์ฆ ๊ฐ์ฒด ๊ฐ์ ์ฐจ์ด๊ฐ ์ถฉ๋ถํ ํฌ์ง ์๊ฑฐ๋ ์ ์๋ฏธํ ํน์ง์ด ๋ถ์กฑํ๋ฉด ๋ค์ค ๊ฐ์ฒด์ ๋ํ ์ ํํ ์๋ณ๊ณผ ์ถ์ ์ด ์ด๋ ค์์ง๊ณ Generalization Performance์ ์ ํ๋ฅผ ์ด๋ํ ์ ์๋ค. ๋ฐ๋ผ์ ReID Model์ ํจ๊ณผ์ ์ผ๋ก ํ์ต์ํค๊ธฐ ์ํด์๋ ๋ฐ์ดํฐ์ ์ด ๊ฐ์ฒด ๊ฐ์ ์ ์๋ฏธํ๊ณ ๊ตฌ๋ณ๋๋ ํน์ง์ ํฌํจํ๊ณ ์์ด์ผํ๋๋ฐ ๋ณธ ํ์ ํ์ต ๋ฐ์ดํฐ๋์ฌ๋๊ณผ ๊ฐ์ด ๊ตฌ๋ณ๋๋ ํน์ง์ ๊ฐ์ง ๊ฐ์ฒด๊ฐ ํฌํจ๋์ง ์์๊ธฐ ๋๋ฌธ์ ReID Model์ DeepSORT์ ์ ์ฉํ์์ ๋ ๋์ ๋๋ ์ฑ๋ฅ์ ํฅ์์ ๋ถ๋ฌ์ฌ ์ ์์์ง ์๋ฌธ์ ๊ฐ์ง๊ฒ ๋์๋ค. ๊ทธ๋์ ReID Model์ DeepSORT์ ์ ์ฉํ์ ๋์ ์ ์ฉํ์ง ์์์ ๋์ ์ฑ๋ฅ ๋น๊ต ์ฐ๊ตฌ๋ฅผ ์ํํ์๊ณ ์๋์ ๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ ์ ์์๋ค.
Triplet Loss๋ ์ด๋ค ํ ๊ฐ์ฒด(Anchor)์ ๊ฐ์ ๊ฐ์ฒด(Positive), ๋ค๋ฅธ ๊ฐ์ฒด(Negative)์ด๋ผ๋ ํ๋ผ๋ฏธํฐ๋ฅผ์ด์ฉํด ํ์ต ์ ๋ฏธ๋ ๋ฐฐ์น ์์์ Anchor, Positive, Negative๋ค์ด ์๋ฒ ๋ฉ ๋ ๊ฐ๋ค์ ์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ๋ฅผ ๊ตฌํด ์๋์ ๊ฐ์ Loss ํจ์๋ฅผ ๋ง๋ ๋ค.
๋๊ดํธ ์์ ์ฒซ๋ฒ์งธ ํญ์ด ์๋ฏธํ๋ ๊ฒ์ Anchor์ Positive๊ฐ์ Distance๊ณ , ๋๋ฒ์งธ ํญ์ Anchor์ Negative์์ Distance์ด๋ฉฐ ฮฑ๋ ๋ง์ง(Hyper Parameter)์ ์๋ฏธํ๋ค. ๋ฐ๋ผ์ L์ ์ต์ํํ๋ค๋ ๊ฒ์ Positive์์ ๊ฑฐ๋ฆฌ๋ ๊ฐ๊น์์ง๋๋ก ํ๊ณ Negative์์ ๊ฑฐ๋ฆฌ๋ ๋ฉ์ด์ง๋๋ก ํ๋ ๊ฒ์ด๋ค. ์ฆ Triplet Loss๊ฐ 0.000์ด ๋์๋ค๋ ๊ฒ์ ReID ๋ชจ๋ธ์ด ํ์ต ์ค์ ๋ชจ๋ Anchor, Positive, Negative ์์ ๋ํด ๊ฑฐ๋ฆฌ๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ๊ตฌ๋ณํ๋ค๋ ์๋ฏธ์ด๋ฉฐ Anchor์ Positive ๊ฐ์ ๊ฑฐ๋ฆฌ๊ฐ Negative ๊ฐ์ ๊ฑฐ๋ฆฌ๋ณด๋ค ์๊ฑฐ๋ ๊ฐ๊ฒ ํ์ต๋์๋ค๋ ๊ฒ์ ๋ํ๋ธ๋ค. ์ฆ ์ด๋ ๋ชจ๋ธ์ด ์ด๋ฏธ ํ์ต ๋ฐ์ดํฐ์์ ์ ์๋ ์ ์ฌ์ฑ ๋ฐ ์ฐจ์ด๋ฅผ ์ดํดํ๊ณ ์์์ ์์ฌํ ์ ์๋ค.
Top-1 Accuracy๋ Softmax Activation Function์์์ Output์์ ์ ์ผ ๋์ ์์น๋ฅผ ๊ฐ์ง๋ ๊ฐ์ด ์ ๋ต์ผ ๊ฒฝ์ฐ์ ๋ํ ์งํ๋ฅผ ๊ณ์ฐํ ๊ฒ์ ์๋ฏธํ๋ค. ์ฆ Top-1 Accuracy๊ฐ 99.2000์ ๊ฐ์ด ๋์ ์์น๊ฐ ๋์๋ค๋ ๊ฒ์ ํด๋น ReID ๋ชจ๋ธ์ด ๋๋ถ๋ถ์ ๊ฒฝ์ฐ์ ๋ํด ๊ฐ์ฅ ๋์ ํ๋ฅ ์ ๊ฐ์ง ํด๋์ค๋ฅผ ์ ํํ๊ฒ ์๋ณํ๋ค๋ ์๋ฏธ์ด๋ฉฐ ์ด๋ ๋ชจ๋ธ์ด ์ฃผ์ด์ง ๋ถ๋ฅ ์์ ์ ์ ์ํํ๊ณ ์์์ ๋ํ๋ธ๋ค.
๋ณธ ํ์ ์์๊ณผ๋ ๋ฌ๋ฆฌ DeepSORT๋ฅผ ์ด์ฉํ MOT ์ํ์ ReID Model์ ์ด์ฉํ ๊ฒฝ์ฐ MOTA(Multi Object Tracking Accuracy)์ฑ๋ฅ์ด 7.7% ํฅ์ํ๋ฉฐ, MOTP(Multi Object Tracking Precision) ์ฑ๋ฅ์ 0.016% ํฅ์ํ ๊ฒ์ ํ์ธํ ์ ์์๋ค. ๋ํ Recall๊ณผ Precision๊ฐ์ด ๊ฐ๊ฐ 0.3%, 6.6% ์ฆ๊ฐํ์๋ค.
๊ณตํต์ผ๋ก ResNet๊ณ์ด์ BackBone ๊ณผ ๊ฐ๊ธฐ ๋ค๋ฅธ Neck,Head๋ฅผ ๊ฐ์ง๊ณ ์๋ค.ํ์ต ์ํ ๊ฒฐ๊ณผ์์ ์ฃผ์ ์ฐจ์ด์ ์ 2-stage-detector Faster_RCNN์์ Feature Pyramid Network(FPN)์ ์ฌ์ฉํ์ฌ ๋ค์ํ ์ค์ผ์ผ๋ก feature map์ ์ถ์ถํ๊ณ Cross Entropy Loss๋ก class๋ฅผ ๋ถ๋ฅํ์ฌ L1 Loss๋ฅผ ํตํ regression์ผ๋ก ๋์ accuracy๋ฅผ ๋ฌ์ฑํ๋ค. 1-stage-detector์ธ YOLOF๋ DilatedEncoder์ Focal Loss,GIoU Loss๋ฅผ ์ฌ์ฉํ๊ณ SSD๋ SSDNeck,SSDHead,Localization Loss,IoU Loss ๋ฅผ ์ฌ์ฉํ์๋ค. ์ข ํฉ์ ์ธ ๊ฒฐ๊ณผ: ๋ชจ๋ธ ๊ฐ๊ฐ์ ํน์ง์ ๋ง๋ Neck,Head ์ ์ฉ๊ณผ Data augmentation์ ์ ์ฉํ์ฌ 0.8์ด์์ ๋์ mAP๋ฅผ ๋ณด์ธ๋ค. ํ๋ก์ ํธ๋ฅผ ํตํด Small Size๋ฅผ ๊ฐ๋ ์กฐ๋ฅ ๋ฐ ๋นํ๋ฌผ์ฒด๋ฅผ ๋์ ์ฑ๋ฅ์ผ๋ก ํ์งํ๊ณ ์ค์๊ฐ ์ถ์ ํ๋ ๋ชจ๋ธ์ ๊ตฌ์ถํ์๋ค. ๋ฐ๋ผ์ ํด๋น ๋ชจ๋ธ์ ์ ์ฉํ๋ค๋ฉด, ์กฐ๋ฅ๋ ๋นํ๋ฌผ์ฒด ๋ฟ๋ง ์๋๋ผ ๋ค๋ฅธ Small Object์ ๊ดํ ๋์ ์ฑ๋ฅ์ Detection ๋ฐ ์ค์๊ฐ ์ถ์ ์ด ๊ฐ๋ฅํ๋ค๊ณ ๊ธฐ๋๋๋ค.
DeepSORT์ ๊ด๋ จํ์ฌ ์ด์ ์ ๋ฐํ๋ ๋ ผ๋ฌธ๋ค์ Re-identification ๋ชจ๋ธ์ ํตํด ์ฌ๋๊ณผ ๊ฐ์ Object ๊ฐ ๊ณ ์ ํ๊ฒ ๊ตฌ๋ณ๋๋ ํน์ง์ ๊ฐ๋ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ๊ณ , ์ด๋ก๋ถํฐ Id-switching์ด๋ Occlusion(ํ์) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์๋ค. ํ์ง๋ง ๋ณธ ํ๋ก์ ํธ์ ์ฌ์ฉ๋ Training Datasets์ Small Size์ ์กฐ๋ฅ๋ ๋นํ๊ธฐ, ๋๋ก ๊ณผ ๊ฐ์ ์๊ณต ๋นํ ๋ฌผ์ฒด์ด๊ธฐ ๋๋ฌธ์, ์ด์ ๋ ผ๋ฌธ๋ค๊ณผ ๋ฌ๋ฆฌ ํ๋์ Class๋ด์์ Object๋ค์ ๊ณ ์ ํ๊ฒ ๋ถ๋ฅํ ๋งํ ํน์ง์ด ์์ ๊ฒ์ด๋ผ ์์ํ์๋ค. ๊ทธ๋ฌ๋ Re-identification ๋ชจ๋ธ ํ์ต ์ ๋ฌด์ ๋ฐ๋ผ Object Tracking ์ฑ๋ฅ์ด ๋ฌ๋ผ์ง๋ ๊ฒ์ ํ์ธํ์๊ณ , ์ด๋ก๋ถํฐ Re-identification ๋ชจ๋ธ์ด ๋คํ์ฑ ๋ฐ ํ์ฉ์ฑ ๋ถ๋ถ์์ ํฅ์๋จ์ ์ฆ๋ช ํ์๋ค.
๊ฐ. ๊ธฐ๋ํจ๊ณผ
- ํญ๊ณต ์์ ํฅ์โ ์กฐ๋ฅ ๋ฐ ๋ฌด์ธ ํญ๊ณต๊ธฐ์ ์ค์๊ฐ ํ์ง ๋ฐ ์ถ์ ์ ํตํด ์กฐ์ข ์ฌ๋ค์๊ฒ ์ถฉ๋ ์ฌ๊ณ ๋ฅผ ์๋ฐฉํ๊ณ ํญ๊ณต ์์ ์ฑ์ ํฅ์์ํฌ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค
- ๋น์ ์ํฉ ๋์ ๊ฐํโ ๋ฌผ์ฒด ์ถ์ ๊ธฐ์ ์ ํ์ฉํ์ฌ ํญ๊ณต ๋ด๋น์๊ฐ ๋น์ ์ํฉ์ ์ ์ํ๊ฒ ๋์ํ๊ณ ํจ๊ณผ์ ์ผ๋ก ๊ด๋ฆฌํ ์ ์๋ค.
- ์๋ํ๋ ๋ชจ๋ํฐ๋ง ์์คํ ๋์ โ ํจ์จ์ ์ธ ๊ฐ์ ๋ฐ ๊ฒฝ๋ณด ์์คํ ์ ํตํด ๊ณตํญ ๋ฐ ํญ๊ณต ๋น๊ตญ์ด ์ค์๊ฐ์ผ๋ก ํญ๊ณต ๊ตํต ์ํฉ์ ๋ชจ๋ํฐ๋งํ๊ณ ์ํ ์ง์ญ์ ์๋ณํ ์ ์๋ค.
- ๋ค์ํ ์ฐ์ ๋ถ์ผ์์ ์์ฉโ ํด์ ๊ฐ์ ๋ฐ ๊ฒฝ๊ณ ๋ณด์, ์์ฐ๋ณด์ ๋ฐ ํ๊ฒฝ ๋ชจ๋ํฐ๋ง ๋ฑ ๋ค์ํ ๋ถ์ผ์ ๋ฌผ์ฒด ํ์ง ๋ฐ ์ถ์ ๊ธฐ์ ์ ์์ฉํ์ฌ ํฅ์๋ ์์ ๋ฐ ํจ์จ์ฑ์ ์ ๊ณตํ ์ ์๋ค.
- ์ฐ๊ตฌ ๋ฐ ๊ต์ก ํ์ฉโ ์์ง๋ ๋ฐ์ดํฐ์ ๊ณผ ๋ชจ๋ธ์ ํ๊ณ์ ์ฐ์ ๊ณ์์ ๊ฐ์ฒด ํ์ง ๋ฐ ์ถ์ ์ ๊ดํ ์ฐ๊ตฌ์ ๊ต์ก์ ํ์ฉ๋ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค.
๋. ํ์ฉ๋ฐฉ์
- ํญ๊ณต ๊ด๋ จ ๊ธฐ๊ด ๋ฐ ๊ณตํญ ์ด์โ ๊ณตํญ ๋ฐ ํญ๊ณต ๋น๊ตญ์ ๊ฐ๋ฐ๋ ์์คํ ์ ๋์ ํ์ฌ ํญ๊ณต ์์ ์ฑ์ ํฅ์์ํค๊ณ , ์ค์๊ฐ ๋ชจ๋ํฐ๋ง์ ํตํด ํญ๊ณต ๊ตํต์ ํจ์จ์ ์ผ๋ก ์ด์ํ ์ ์๋ค.
- ๋น์ ์ํฉ ๋์ ๋ฐ ๊ด๋ฆฌ ๊ธฐ๊ดโ ๋น์ ์ํฉ ๋์ ๊ธฐ๊ด์ ์ค์๊ฐ ์ถ์ ๊ฒฐ๊ณผ๋ฅผ ํ์ฉํ์ฌ ์ฌ๊ณ ํ์ฅ์ ๋น ๋ฅด๊ฒ ๋์ํ๊ณ , ์ํฉ์ ํจ๊ณผ์ ์ผ๋ก ๊ด๋ฆฌํ ์ ์๋ค.
- ํด์ ๊ฐ์ ๋ฐ ๊ฒฝ๊ณ ๋ณด์โ ํด๊ตฐ ๋ฐ ๊ฒฝ๋น ๋น๊ตญ์ ๋ฌผ์ฒด ํ์ง ๋ฐ ์ถ์ ๊ธฐ์ ์ ํด์ ๊ฐ์์ ํ์ฉํ์ฌ ์นจ์ ์ด๋ ์ํํ ์ํฉ์ ์ ์ํ ๊ฐ์งํ๊ณ ๋์ํ ์ ์๋ค.
- ํ๊ฒฝ ๋ณด์ ๋ฐ ์ํํ ์ฐ๊ตฌโ ํ๊ฒฝ ๋น๊ตญ ๋ฐ ์ฐ๊ตฌ ๊ธฐ๊ด์ ๋ฌผ์ฒด ์ถ์ ๊ธฐ์ ์ ์ด์ฉํ์ฌ ์กฐ๋ฅ ๋ฐ ๋๋ฌผ์ ์ด๋์ ์ฐ๊ตฌํ๊ณ ํ๊ฒฝ ๋ณด์ ํ๋์ ํ์ฉํ ์ ์๋ค.
- ์ฐ๊ตฌ ๋ฐ ๊ต์ก ๊ธฐ๊ดโ ๋ํ ๋ฐ ์ฐ๊ตฌ ๊ธฐ๊ด์ ์์ง๋ ๋ฐ์ดํฐ์ ๊ณผ ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๊ฐ์ฒด ํ์ง ๋ฐ ์ถ์ ์ ๊ดํ ์ฐ๊ตฌ๋ฅผ ์ํํ๊ณ , ๊ต์ก ๊ณผ์ ์ ํ์ฉํ ์ ์๋ค.
ํ๋ก์ ํธ ๊ฒฐ๊ณผ๋ก ์ป์ ๋ชจ๋ธ๊ณผ ๋ฐ์ดํฐ๋ ํญ๊ณต ๋ฐ ๊ตญ๋ฐฉ ๊ด๋ จ ์ฐ์ ์์์ ์์ ๋ฐ ํจ์จ์ฑ ํฅ์์ ํฐ ๊ธฐ์ฌ๋ฅผ ํ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค. ๋ฏธ๋์๋ ๋ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ๋ชจ๋ธ์ ํ๋ํ์ฌ ๋ค์ํ ์ํฉ์์์ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๋์ผ์ ์์๊ฒ์ด๋ค.



