-
해외와 달리 국내의 경우 드론을 활용하여 사람 및 사물 등을 촬영하여 공개된 데이터셋이 전무함.
-
드론을 활용한 영상 인식 기술(객체 검출, 추적, 계수) 개발에 필요한 사람 및 사물 관련 데이터셋을 제공함.
-
안전, 교통, 보안 등의 드론을 활용한 다양한 지능형 영상 인식 산업 분야에 활용 가능함.
-
데이터 개요
-
해상도: 1920 x 1080(Full HD)
-
프레임률: 15 FPS(Frames Per Second)
-
총 210 개 비디오 클립 중 70 개 비디오 클립을 본 저장소에 공개(3개의 참여 업체가 70 개씩 배분하여 각 업체별로 저장소에 공개)
-
각 비디오 클립 폴더는 아래와 같은 파일들을 포함함.
-
이미지 파일 450개(jpg 포맷)
-
Ground Truth 파일 1개(json 포맷)
-
동영상 파일 1개(mp4 포맷)
-
-
-
어노테이션 대상 및 방법
-
대상
-
각 이미지에서 구분 가능한 6개의 “사람 및 사물”을 찾아 바운딩박스 좌표를 어노테이션 하고, 클래스 ID와 고유 ID(객체 ID)를 라벨링함.
-
이 때 “사람 및 사물(이하 대상)”은 “사람, 소화기, 소화전, 차량, 자전거, 오토바이”로 한정함.
-
클래스 ID, 객체 ID, 겹침 및 잘림 여부를 함께 라벨링함.
-
승용차, 승합차, 버스, 트럭 및 트레일러 모두 차량으로 인지하여 계수함.
-
하나의 비디오 클립(450개 이미지) 내 등장하는 전체 인물 및 사물의 수는 클래스별로 중복 없이 계수하여 라벨링함.
-
-
방법
-
이미지에 나타나는 대상이 좌표로 표현되는 영역의 단축 기준 25 픽셀 이상일 경우, 1개(인) 단위의 바운딩박스로 처리함.
-
대상이 겹치거나 화면에서 잘리더라도 픽셀 기준을 만족하며 육안으로 명확하게 대상으로 인지를 할 수 있다면, 이를 포함하여 처리함.
-
동일한 대상으로 판단한 “사람 및 사물”은 하나의 비디오 클립 내 여러 번 등장하더라도 동일한 객체 ID를 가짐.
-
객체의 크기는 동영상 내 해당 객체가 최초 등장 후 좌상단, 우하단 좌표로 표현되는 영역의 단축기준으로 25 픽셀 이상이면 대상 객체로 인정함.
-
공개를 목적으로 하는 데이터이므로, 개인정보 보호를 위해 육안으로 식별 가능한 사람의 얼굴, 차량의 번호판 등은 흐리게 처리함.
-
-
-
아래는 본 저장소에 대한 통계로서, 전체 통계 및 상세 내용은 데이터셋_통계.xlsx 파일을 참고할 것.
-
객체 통계
객체 클래스 아이디 객체 수 Person(사람) c_1 594 Fire Extinguisher(소화기) c_2 39 Fire Hydrant(소화전) c_3 10 Car(차량) c_4 144 Bicycle(자전거) c_5 57 Motorcycle(오토바이) c_6 33 합계 877 -
촬영조건 통계
촬영 조건 비디오 클립 개수 일출 맑음 0 일출 흐림 0 일출 비 0 낮 맑음 29 낮 흐림 41 낮 비 0 일몰 맑음 0 일몰 흐림 0 일몰 비 0 합계 70
-
최상위의 data 디렉토리에는 비디오 클립명으로 된 폴더들이 70개 있음.
-
각 비디오 클립 폴더 내부에는 image 폴더, json 파일, mp4 파일 등이 있음.
-
mp4 파일
- 동영상 파일
-
image 폴더
-
json 파일
-
해당 비디오 클립에 대한 Ground Truth 파일
-
파일 내용 예시
{ // 동영상 클립명 "0615_V0049": { "videos": { ... { // 시퀀스 아이디 "id": "00248", "objects": [ { // 오브젝트 아이디 "id": "00000", // 클래스 아이디 "class_ID": "c_1", // 바운딩박스 좌표값 "position": [ 1775, 278, 1908, 741 ], // 오브젝트의 가려짐 여부 "obsecured": "True", // 오브젝트의 잘림 여부 "truncated": "True" }, { "id": "00005", "class_ID": "c_1", "position": [ 549, 358, 707, 773 ], "obsecured": "False", "truncated": "False" }, { "id": "00007", "class_ID": "c_1", "position": [ 1560, 293, 1762, 713 ], "obsecured": "True", "truncated": "False" }, { "id": "00009", "class_ID": "c_1", "position": [ 0, 837, 95, 1080 ], "obsecured": "True", "truncated": "True" }, { "id": "00010", "class_ID": "c_1", "position": [ 594, 304, 753, 705 ], "obsecured": "True", "truncated": "False" }, { "id": "00014", "class_ID": "c_4", "position": [ 523, 0, 1545, 595 ], "obsecured": "True", "truncated": "True" } ] }, ...
-
-
회사명 | 부서명 | 이름 | 전화번호 | 이메일 |
---|---|---|---|---|
㈜ 엠티콤 | 서비스기획팀 | 유한별 | 070-4671-0084 | onestar@mtcom.co.kr |
-
본 데이터셋은 과학기술정보통신부의 인공지능산업원천기술개발 사업(과제번호: 2019-0-01763)의 일환으로 구축되었으며, 공개 S/W로 제공됨.
-
데이터셋은 대용량 다운로드를 고려하여 참여 업체당 1개씩, 총 3개의 저장소로 분리하여 저장하였으며, 각 저장소 마다 70개씩 전체 210개의 비디오 클립이 있음.
-
본 저장소에는 141번째부터 210번째까지의 70개 비디오 클립에 대한 데이터셋이 저장되어 있음.
-
저장소 1 링크: https://github.com/laonbud-grandsys/drone-vis-recog-datasets-1
-
저장소 2 링크: https://github.com/zum-lab/drone-vis-recog-datasets-2
-
다른 저장소의 다운로드 링크: http://13.125.213.200/