- 2025 무인이동체산업엑스포 2025-07-09 ~ 2025-07-11 Hall C
자율주행 차량용 다중센서 융합형 3D 동적객체 검출 추적 학습 데이터 / 사진. 카카오모빌리티
카카오모빌리티가 국내 자율주행 연구 생태계 활성화를 위해 '미래의 석유'라 불리는 고품질 자율주행 데이터를 무상으로 공개한다. 카카오모빌리티는 과학기술정보통신부와 함께 구축한 'AI 학습용 자율주행 데이터셋' 15만 건을 한국전자통신연구원(ETRI)의 'AI 나눔' 플랫폼을 통해 제공한다고 2월 28일(금) 밝혔다.
이번 데이터셋 공개는 자율주행기술개발혁신사업단(이하 KADIF)의 '자율주행 기술개발 혁신사업' 국책과제의 일환으로, 레벨4 자율주행 구현을 목표로 한다. 카카오모빌리티는 ▲차량 ▲엣지-인프라 ▲지능학습을 연계한 융합형 자율주행 데이터 생성·관리·배포 자동화 기술 개발을 완료하고, 국내 도로 환경에 최적화된 비식별화 데이터셋을 일반에 공개했다.
그동안 소규모 기업이나 학계에서는 막대한 비용과 시간 때문에 자율주행 데이터 확보에 어려움을 겪었다. 또한, 기존 공개 데이터셋은 대부분 해외 데이터라 국내 연구에 한계가 존재했다.
이번에 공개된 데이터셋은 카카오모빌리티가 직접 운영한 자율주행차와 국내 주요 도로변 엣지-인프라를 통해 수집됐다. 사람, 차량, 자전거 등 3D 동적 객체와 신호등, 표지만 등 2D 정적 객체를 인지·판단하는 10개 유형의 15만 건 데이터로 구성돼 국내 환경에 특화된 AI 모델 개발을 지원한다.
특히, 도로 타입, 시간, 날씨 등 31개 카테고리의 다양한 환경 조건에서 수집됐으며, 라이다 센서 기반 포인트클라우드 좌표값과 세분화된 객체 속성 데이터를 포함해 활용 가치를 높였다. ETRI는 해당 데이터셋을 자율주행 차량에 학습시켜 실증한 결과, 3D 동적 객체 검출 AI 성능은 5~8%, 신호등 인식 AI 성능은 2% 향상되는 효과를 확인했다. 도심지 야간 교통 정체, 보행자 신호등 등 희소 데이터에 대한 AI 성능 향상도 뚜렷하게 나타났다.
카카오모빌리티 장성욱 미래이동연구소장은 "이번 데이터셋 공개가 국내 자율주행 기술상용화와 발전을 앞당기는 초석이 되길 기대한다"라며 "다양한 공공·민간기업과의 협력을 통해 자율주행 기술 혁신과 공공 데이터 활용 확대에 앞장설 것"이라고 말했다.
KADIF 장광복 단장은 "15만 건의 융합형 자율주행 학습 데이터셋 공개를 통해 관련 학계와 스타트업 성장에 기여하고, AI 자율주행 기술 고도화를 이끌겠다"라고 밝혔다.