1. ๊ฐ์ฒด ํ์ง ์๊ฐยถ
๊ฐ์ฒด ํ์ง(Object Detection)๋ ์ปดํจํฐ ๋น์ ๊ธฐ์ ์ ์ธ๋ถ ๋ถ์ผ์ค ํ๋๋ก์จ ์ฃผ์ด์ง ์ด๋ฏธ์ง๋ด ์ฌ์ฉ์๊ฐ ๊ด์ฌ ์๋ ๊ฐ์ฒด๋ฅผ ํ์งํ๋ ๊ธฐ์ ์ ๋๋ค.
์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ด ๊ทธ๋ฆผ 1-1 ์ข์ธก์ ์๋ ๊ฐ์์ง ์ฌ์ง์ ๊ฐ์์ง๋ผ๊ณ ํ๋ณํ๋ค๋ฉด ํด๋น ๋ชจ๋ธ์ ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ชจ๋ธ ์ ๋๋ค. ํ์ง๋ง ์ฐ์ธก ์ฌ์ง ์ฒ๋ผ ๋ฌผ์ฒด๊ฐ ์๋ ์์น๋ฅผ ํ์งํจ๊ณผ ๋์์ ํด๋น ๋ฌผ์ฒด๊ฐ ๊ฐ์์ง๋ผ๊ณ ๋ถ๋ฅ ํ๋ค๋ฉด ํด๋น ๋ชจ๋ธ์ ๊ฐ์ฒด ํ์ง ๋ชจ๋ธ์ ๋๋ค.
๊ทธ๋ฆผ 1-1 ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ชจ๋ธ๊ณผ ๊ฐ์ฒด ํ์ง ๋ชจ๋ธ ๋น๊ต (์ถ์ฒ: https://www.pexels.com/search/dog/)
๊ฐ์ฒด ํ์ง ๋ชจ๋ธ์ ์ฌ๋ฌ ๋ถ์ผ์์ ํ์ฉ ๊ฐ๋ฅํฉ๋๋ค. ๊ฐ์ฅ ๋ํ์ ์ธ ํ์ฉ ์ฌ๋ก๋ ์์จ ์ฃผํ ์๋์ฐจ์ ๋๋ค. ์์จ ์ฃผํ ์๋์ฐจ๋ฅผ ๋ง๋ค๊ธฐ ์ํด์๋ ์ปดํจํฐ๊ฐ ์ค์ค๋ก ์ฃผ๋ณ ์ฌ๋ฌผ์ ์ธ์ํ ์ ์์ด์ผ ํฉ๋๋ค. ์ ์ง ์ ํธ๊ฐ ์์ ๋ ์๋๋ฅผ ์ค์ด๊ณ ์ด๋ก๋ถ์ด ์ผ์ง๋ฉด ๋ค์ ์ฃผํ์ ์์ํ๋ ๋ฑ ์ฃผ๋ณ ํ๊ฒฝ๊ณผ ์ํธ์์ฉ์ด ํ์ํ ์์จ ์ฃผํ ์๋์ฐจ์ ๊ฐ์ฒด ํ์ง ๊ธฐ์ ์ด ์ฌ์ฉ ๋ฉ๋๋ค.
๊ฐ์ฒด ํ์ง ๊ธฐ์ ์ ๋ณด์ ๋ถ์ผ์์ ํจ์จ์ ์ธ ์์ ๊ด๋ฆฌ์๋ ์ฌ์ฉ๋ฉ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก CCTV๋ ์ฌ์ง ์๊ณ ๊ธฐ๋ก์ด ๋๊ธฐ ๋๋ฌธ์ ๋ฐฉ๋ํ ์์ ๋ฉ๋ชจ๋ฆฌ๊ฐ ํ์ํฉ๋๋ค. ํ๋ ๊ฐ์ฒด ํ์ง ๊ธฐ์ ๊ณผ ๊ฒฐํฉํ์ฌ ํน์ ์ฌ๋ฌผ์ด ํ์ง ๋์์ ๋๋ง ๊ธฐ๋ก์ ์์ํ๋ฉด ๋ฉ๋ชจ๋ฆฌ๋ฅผ ํจ์จ์ ์ผ๋ก ์ฌ์ฉํ ์ ์์ต๋๋ค.
์ด๋ฒ ์ฅ์์๋ ๋ง์คํฌ๋ฅผ ํ์งํ๋ ๊ฐ์ฒด ํ์ง ๋ชจ๋ธ์ ๊ตฌ์ถํด๋ณด๊ฒ ์ต๋๋ค. ์ฃผ์ด์ง ์ด๋ฏธ์ง๋ฅผ ์ ๋ ฅ์ ๋ฐ์์ ๋ ์ผ๊ตด ์์น๋ฅผ ํ์งํ๊ณ , ์ผ๊ตด์ ๋ง์คํฌ๊ฐ ์์ฌ์ ธ ์๋์ง๋ฅผ ํ์ธํ๋ ๋ชจ๋ธ์ ๊ตฌ์ถํด๋ณผ ๊ฒ์ ๋๋ค.
1.1. ๋ฐ์ด๋ฉ ๋ฐ์คยถ
๊ฐ์ฒด ํ์ง ๋ชจ๋ธ์ ๋ง๋ค๊ธฐ์ ์์, ์ฐ์ ์ ๋์ด์ผ ํ ๊ณผ์ ์ ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ๋ง๋๋ ๊ฒ ์ ๋๋ค. ๊ฐ์ฒด ํ์ง ๋ชจ๋ธ์ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์ ํฌ๊ธฐ๊ฐ ๋ฐฉ๋ํ๊ธฐ ๋๋ฌธ์, ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ํตํ์ฌ ๊ฐ์ฒด๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ํ์งํ๊ณ ๋ฅ๋ฌ๋ ๊ณผ์ ์์ ๋ฐ์ด๋ฉ ๋ฐ์ค ์์ญ๋ง ๋์์ด ๋๊ธฐ ๋๋ฌธ์, ๋ฅ๋ฌ๋์ ํจ์จ์ ์ผ๋ก ์ํํ ์ ์์ต๋๋ค.
๋ฐ์ด๋ฉ ๋ฐ์ค๋ ํน์ ์ฌ๋ฌผ์ ํ์งํ์ฌ ๋ชจ๋ธ์ ํจ์จ์ ์ผ๋ก ํ์ต ํ ์ ์๋๋ก ๋์์ ์ฃผ๋ ๋ฐฉ๋ฒ์ ๋๋ค. ๊ฐ์ฒด ํ์ง ๋ชจ๋ธ์์ ๋ฐ์ด๋ฉ ๋ฐ์ค๋ ํ๊ฒ ์์น๋ฅผ ํน์ ํ๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค. ํ๊ฒ ์์น๋ฅผ X์ Y์ถ์ ์ด์ฉํ์ฌ ์ฌ๊ฐํ์ผ๋ก ํํํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ๋ฐ์ด๋ฉ ๋ฐ์ค ๊ฐ์ (X ์ต์๊ฐ, Y ์ต์๊ฐ, X ์ต๋๊ฐ, Y ์ต๋๊ฐ)์ผ๋ก ํํ์ด ๋ฉ๋๋ค.
๊ทธ๋ฆผ 1-2 ๋ฐ์ด๋ฉ ์์ญ ํฝ์ ๊ฐ์ผ๋ก ์ง์ (์ถ์ฒ: https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Object-Detection)
๊ทธ๋ฆผ 1-2์ ๊ฐ์ด X์ Y์ ์ต์๊ฐ๊ณผ ์ต๋๊ฐ ์ฌ์ด์ ๋ฉด์ ์ ๋ฐ์ด๋ฉ ๋ฐ์ค ์์ญ์ผ๋ก ์ก์ต๋๋ค. ํ์ง๋ง, ์์ X, Y ๊ฐ์ ํฝ์ ๊ฐ์ผ๋ก ํจ์จ์ ์ธ ์ฐ์ฐ์ ์ํด์๋ ์ต๋๊ฐ 1๋ก ๋ณํ์ ํด์ค์ผ ํฉ๋๋ค.
๊ทธ๋ฆผ 1-3 ๋ฐ์ด๋ฉ ์์ญ ๋ฐฑ๋ถ์๋ก ์ง์ (์ถ์ฒ: https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Object-Detection/raw/master/img/bc2.PNG)
๊ทธ๋ฆผ 1-3์ X, Y ๊ฐ์ ๊ฐ๊ฐ X์ ์ต๋๊ฐ 971, Y์ ์ต๋๊ฐ 547์ ๋๋ ๊ฐ์ ๋๋ค. X์ ์ต์๊ฐ์ 640์์ 971์ ๋๋๋ฉด 0.66์ด ๋๋ ๊ฒ์ ๋๋ค. ์ด๋ ๊ฒ ๋ถ์ํ๋ ํจ์จ์ ์ธ ์ฐ์ฐ์ ์ํ ๊ณผ์ ์ด๋ผ๊ณ ๋ณผ ์ ์์ง๋ง, ํ์์ ์ธ ๊ณผ์ ์ ์๋๋๋ค.
๋ฐ์ดํฐ์ ์ ๋ฐ๋ผ, ๋ฐ์ด๋ฉ ๋ฐ์ค ๊ฐ์ด ๋ฉํ๋ฐ์ดํฐ๋ก ๋ฐ๋ก ํฌํจ๋ ๊ฒฝ์ฐ๊ฐ ์์ผ๋ฉฐ, ๋ฉํ๋ฐ์ดํฐ๊ฐ ์์ ๊ฒฝ์ฐ ๋ฐ๋ก ์ฝ๋ ๊ตฌํ์ ํตํด ๋ฐ์ด๋ฉ ๋ฐ์ค ์ง์ ์ด ๊ฐ๋ฅํฉ๋๋ค. ๋ณธ ํํ ๋ฆฌ์ผ์์ ์ฌ์ฉํ๋ Face Mask Detection ๋ฐ์ดํฐ์ ์๋ ๋ฐ์ด๋ฉ ๋ฐ์ค๊ฐ ํจ๊ป ์ ๊ณต๋๋ฉฐ, 2์ฅ์์ ๋ฐ์ด๋ฉ ๋ฐ์ค ๋์ํ๋ฅผ ์งํํด๋ณด๊ฒ ์ต๋๋ค.
1.2. ๋ชจ๋ธ ํํยถ
๊ฐ์ฒด ํ์ง ๋ชจ๋ธ์ ํฌ๊ฒ One-Stage ๋ชจ๋ธ๊ณผ Two-Stage ๋ชจ๋ธ๋ก ๊ตฌ๋ถํ ์ ์์ต๋๋ค. ๊ฐ๊ฐ์ ๋ชจ๋ธ ํํ์ ๋ํด์ ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๊ทธ๋ฆผ 1-4 ๊ฐ์ฒด ํ์ง ์๊ณ ๋ฆฌ์ฆ ํ์๋ผ์ธ (์ถ์ฒ: Zou et al. 2019. Object Detection in 20 Years: A Survey)
๊ทธ๋ฆผ 1-4๋ ๊ฐ์ฒด ํ์ง ๋ชจ๋ธ์ ๊ณ๋ณด๋๋ฅผ ๋ํ๋ด๊ณ ์์ต๋๋ค. 2012๋ ์ดํ ๋ฑ์ฅํ ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ์ ๊ฐ์ฒด ํ์ง ๋ชจ๋ธ ์ข ๋ฅ๋ One-Stage Detector, Two-Stage Detector๋ก ๋๋ ์ ์์ต๋๋ค. ๋ ์ข ๋ฅ์ ํ๋ฆ์ ์ดํดํ๊ธฐ ์ํด์ Classification๊ณผ Region Proposal์ ๊ฐ๋ ์ ์ดํดํด์ผ ํฉ๋๋ค. Classification์ ํน์ ๋ฌผ์ฒด์ ๋ํด ์ด๋ค ๋ฌผ์ฒด์ธ์ง ๋ถ๋ฅ๋ฅผ ํ๋ ๊ฒ์ด๊ณ , Region Proposal์ ๋ฌผ์ฒด๊ฐ ์์๋งํ ์์ญ์ ๋น ๋ฅด๊ฒ ์ฐพ์๋ด๋ ์๊ณ ๋ฆฌ์ฆ ์ ๋๋ค.
Two-Stage Detector์ ๊ฐ์ฒด๋ฅผ ๊ฒ์ถํ๋ ์ ํ๋ ์ธก๋ฉด์์๋ ์ข์ ์ฑ๋ฅ์ ๋์ง๋ง, ์์ธก ์๋๊ฐ ๋๋ ค ์ค์๊ฐ ํ์ง์๋ ์ ํ๋์ต๋๋ค. ์ด๋ฌํ ์๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด Classification๊ณผ Region Propsal์ ๋์์ ํ๋ One-Stage Detector๊ฐ ์ ์๋์์ต๋๋ค. ๋ค์ ์ ์์ One-Stage Detector์ Two-Stage Detector์ ๊ตฌ์กฐ๋๋ฅผ ํ์ธํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
1.2.1. One-Stage Detectorยถ
One-stage Detector๋ Classification, Regional Proposal์ ๋์์ ์ํํ์ฌ ๊ฒฐ๊ณผ๋ฅผ ์ป๋ ๋ฐฉ๋ฒ์ ๋๋ค. ๊ทธ๋ฆผ 1-5์ ๊ฐ์ด ์ด๋ฏธ์ง๋ฅผ ๋ชจ๋ธ์ ์ ๋ ฅ ํ, Conv Layer๋ฅผ ์ฌ์ฉํ์ฌ ์ด๋ฏธ์ง ํน์ง์ ์ถ์ถํฉ๋๋ค.
๊ทธ๋ฆผ 1-5 One-Stage Detector ๊ตฌ์กฐ(์ถ์ฒ:https://jdselectron.tistory.com/101)
1.2.2. Two-Stage Detectorยถ
Two-stage Detector๋ Classification, Regional Proposal์ ์์ฐจ์ ์ผ๋ก ์ํํ์ฌ ๊ฒฐ๊ณผ๋ฅผ ์ป๋ ๋ฐฉ๋ฒ์ ๋๋ค. ๊ทธ๋ฆผ 1-6๊ณผ ๊ฐ์ด Region Proposal๊ณผ Classification์ ์์ฐจ์ ์ผ๋ก ์คํํ๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
๊ทธ๋ฆผ 1-6 Two-Stage Detector ๊ตฌ์กฐ(์ถ์ฒ:https://jdselectron.tistory.com/101)
๊ฒฐ๊ณผ์ ์ผ๋ก One-Stage Detector๋ ๋น๊ต์ ๋น ๋ฅด์ง๋ง ์ ํ๋๊ฐ ๋ฎ๊ณ , Two-Stage Detector๋ ๋น๊ต์ ๋๋ฆฌ์ง๋ง ์ ํ๋๊ฐ ๋์ต๋๋ค.
1.3. ๋ชจ๋ธ ๊ตฌ์กฐยถ
One-Stage Detector์ Two-stage Detector ๋ณ๋ก ์ฌ๋ฌ ๊ตฌ์กฐ๊ฐ ์กด์ฌํฉ๋๋ค. R-CNN, Fast R-CNN, Faster R-CNN์ Two-Stage Detector์ด๋ฉฐ YOLO, SSD, RetinaNet์ One-Stage Detector์ ๋๋ค. ๊ฐ๊ฐ์ ๋ชจ๋ธ ๊ตฌ์กฐ ํน์ฑ์ ๋ํด ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
1.3.1. R-CNNยถ
๊ทธ๋ฆผ 1-8 R-CNN ๊ตฌ์กฐ (์ถ์ฒ: Girshick et al. 2014. Rich feature gierarchies for accurate object detection and semantic segmentation)
R-CNN์ Selective Search๋ฅผ ์ด์ฉํด ์ด๋ฏธ์ง์ ๋ํ ํ๋ณด์์ญ(Region Proposal)์ ์์ฑํฉ๋๋ค. ์์ฑ๋ ๊ฐ ํ๋ณด์์ญ์ ๊ณ ์ ๋ ํฌ๊ธฐ๋ก wrappingํ์ฌ CNN์ input์ผ๋ก ์ฌ์ฉํฉ๋๋ค. CNN์์ ๋์จ Feature map์ผ๋ก SVM์ ํตํด ๋ถ๋ฅ, Regressor์ ํตํด Bounding-box๋ฅผ ์กฐ์ ํฉ๋๋ค. ๊ฐ์ ๋ก ํฌ๊ธฐ๋ฅผ ๋ง์ถ๊ธฐ ์ํ wrapping์ผ๋ก ์ด๋ฏธ์ง์ ๋ณํ์ด๋ ์์ค์ด ์ผ์ด๋๊ณ ํ๋ณด์์ญ๋งํผ CNN์ ๋๋ ค์ผํํ๊ธฐ ๋๋ฌธ์ ํฐ ์ ์ฅ๊ณต๊ฐ์ ์๊ตฌํ๊ณ ๋๋ฆฌ๋ค๋ ๋จ์ ์ด ์์ต๋๋ค.
1.3.2. Fast R-CNNยถ
๊ทธ๋ฆผ 1-9 Fast R-CNN ๊ตฌ์กฐ (์ถ์ฒ: Girshick. ICCV 2015. Fast R-CNN)
๊ฐ ํ๋ณด์์ญ์ CNN์ ์ ์ฉํ๋ R-CNN๊ณผ ๋ฌ๋ฆฌ ์ด๋ฏธ์ง ์ ์ฒด์ CNN์ ์ ์ฉํ์ฌ ์์ฑ๋ Feature map์์ ํ๋ณด์์ญ์ ์์ฑํฉ๋๋ค. ์์ฑ๋ ํ๋ณด์์ญ์ RoI Pooling์ ํตํด ๊ณ ์ ์ฌ์ด์ฆ์ Feature vector๋ก ์ถ์ถํฉ๋๋ค. Feature vector์ FC layer๋ฅผ ๊ฑฐ์ณ Softmax๋ฅผ ํตํด ๋ถ๋ฅ, Regressor๋ฅผ ํตํด Bounding-box๋ฅผ ์กฐ์ ํฉ๋๋ค.
1.3.3. Faster R-CNNยถ
๊ทธ๋ฆผ 1-10 Faster R-CNN ๊ตฌ์กฐ (์ถ์ฒ: Ren et al. 2016. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks)
Selective Search ๋ถ๋ถ์ ๋ฅ๋ฌ๋์ผ๋ก ๋ฐ๊พผ Region Proposal Network(RPN)์ ์ฌ์ฉํฉ๋๋ค. RPN์ Feature map์์ CNN ์ฐ์ฐ์ sliding-window๊ฐ ์ฐ์ ์ง์ ๋ง๋ค Anchor-box๋ก ํ๋ณด์์ญ์ ์์ธกํฉ๋๋ค. Anchor-box๋ ๋ฏธ๋ฆฌ ์ง์ ํด๋์ ์ฌ๋ฌ ๊ฐ์ ๋น์จ๊ณผ ํฌ๊ธฐ์ Bounding-box์ ๋๋ค. RPN์์ ์ป์ ํ๋ณด์์ญ์ IoU์์ผ๋ก ์ ๋ ฌํ์ฌ Non-Maximum Suppression(NMS) ์๊ณ ๋ฆฌ์ฆ์ ํตํด ์ต์ข ํ๋ณด์์ญ์ ์ ํํฉ๋๋ค. ์ ํ๋ ํ๋ณด์์ญ์ ํฌ๊ธฐ๋ฅผ ๋ง์ถ๊ธฐ ์ํด RoI Pooling์ ๊ฑฐ์น๊ณ ์ดํ Fast R-CNN๊ณผ ๋์ผํ๊ฒ ์งํํฉ๋๋ค.
1.3.4. YOLOยถ
๊ทธ๋ฆผ 1-11 YOLO ๊ตฌ์กฐ (์ถ์ฒ: Redmon et al. 2016. You Only Look Once: Unified, Real-Time Object Detection)
Bouning-box์ Class probability๋ฅผ ํ๋์ ๋ฌธ์ ๋ก ๊ฐ์ฃผํ์ฌ ๊ฐ์ฒด์ ์ข ๋ฅ์ ์์น๋ฅผ ํ๋ฒ์ ์์ธกํฉ๋๋ค.์ด๋ฏธ์ง๋ฅผ ์ผ์ ํฌ๊ธฐ์ ๊ทธ๋ฆฌ๋๋ก ๋๋ ๊ฐ ๊ทธ๋ฆฌ๋์ ๋ํ Bounding-box๋ฅผ ์์ธกํฉ๋๋ค. Bounding-box์ confidence score์ ๊ทธ๋ฆฌ๋์ ์ class score์ ๊ฐ์ผ๋ก ํ์ตํ๊ฒ ๋ฉ๋๋ค. ๊ฐ๋จํ ์ฒ๋ฆฌ๊ณผ์ ์ผ๋ก ์๋๊ฐ ๋งค์ฐ ๋น ๋ฅด์ง๋ง ์์ ๊ฐ์ฒด์ ๋ํด์๋ ์๋์ ์ผ๋ก ์ ํ๋๊ฐ ๋ฎ์ต๋๋ค.
1.3.5. SSDยถ
๊ทธ๋ฆผ 1-12 SSD ๊ตฌ์กฐ (์ถ์ฒ: Liu et al. 2016. SSD: Single Shot MultiBox Detector)
๊ฐ Covolutional Layer ์ดํ์ ๋์ค๋ Feature map๋ง๋ค Bounding-box์ Class ์ ์์ Offset(์์น์ขํ)๋ฅผ ๊ตฌํ๊ณ , NMS ์๊ณ ๋ฆฌ์ฆ์ ํตํด ์ต์ข Bounding-box๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. ์ด๋ ๊ฐ Feature map๋ง๋ค ์ค์ผ์ผ์ด ๋ค๋ฅด๊ธฐ ๋๋ฌธ์ ์์ ๋ฌผ์ฒด์ ํฐ ๋ฌผ์ฒด๋ฅผ ๋ชจ๋ ํ์งํ ์ ์๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค.
1.3.6. RetinaNetยถ
๊ทธ๋ฆผ 1-13 Focal Loss (์ถ์ฒ: Lin et al. 2018. Focal Loss for Dense Object Detection)
RetinaNet์ ๋ชจ๋ธ ํ์ต์ ๊ณ์ฐํ๋ ์์ค ํจ์(loss function)์ ๋ณํ๋ฅผ ์ฃผ์ด ๊ธฐ์กด One-Stage Detector๋ค์ด ์ง๋ ๋ฎ์ ์ฑ๋ฅ์ ๊ฐ์ ํ์ต๋๋ค. One-Stage Detector๋ ๋ง๊ฒ๋ ์ญ๋ง๊ฐ ๊น์ง์ ํ๋ณด๊ตฐ ์ ์๋ฅผ ํตํด ํ์ต์ ์งํํฉ๋๋ค. ๊ทธ ์ค ์ค์ ๊ฐ์ฒด์ธ ๊ฒ์ ์ผ๋ฐ์ ์ผ๋ก 10๊ฐ ์ด๋ด ์ด๊ณ , ๋ค์์ ํ๋ณด๊ตฐ์ด background ํด๋์ค๋ก ์กํ๋๋ค. ์๋์ ์ผ๋ก ๋ถ๋ฅํ๊ธฐ ์ฌ์ด background ํ๋ณด๊ตฐ๋ค์ ๋ํ loss๊ฐ์ ์ค์ฌ์ค์ผ๋ก์จ ๋ถ๋ฅํ๊ธฐ ์ด๋ ค์ด ์ค์ ๊ฐ์ฒด๋ค์ loss ๋น์ค์ ๋์ด๊ณ , ๊ทธ์ ๋ฐ๋ผ ์ค์ ๊ฐ์ฒด๋ค์ ๋ํ ํ์ต์ ์ง์คํ๊ฒ ํฉ๋๋ค. RetinaNet์ ์๋ ๋น ๋ฅด๋ฉด์ Two-Stage Detector์ ์ ์ฌํ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค