“공동 활용할 자율주행 데이터 체계” 과기정통부, 첫 표준 발표

“본 가이드라인을 통해 공동 활용 가능한 자율주행 데이터 체계가 구축되고, 고품질 데이터 기반의 자율주행 기술력을 확보할 수 있는 토대가 마련됐다.”

박태완 과기정통부 정보통신산업정책관이 19일 꺼낸 이 한 마디에는 한국 자율주행 업계가 오래 품어온 숙원이 담겨 있어요. 회사마다, 기관마다 제각각인 데이터 형식 탓에 정작 중요한 AI 학습용 데이터를 서로 나누지 못한다는 현실을 깨기 위한 첫걸음이기 때문이죠.

과학기술정보통신부는 19일 ‘자율주행 E2E 데이터 구축 가이드라인 및 규격 정의서’를 발표했다. 한국에서 자율주행 AI 학습용 데이터의 표준을 정부 차원에서 제시한 건 이번이 처음이다. 한국전자통신연구원(ETRI)이 개발을 주도했고, 정보통신기획평가원(IITP)과 자율주행기술개발혁신사업단(KADIF)이 참여했다.

가이드라인이 주목하는 건 E2E(End-to-End) AI다. 기존 자율주행은 인지·판단·제어를 각각 별도 모듈로 처리했지만, E2E는 하나의 AI 모델이 이 모든 과정을 한 번에 수행한다. 테슬라 FSD, 웨이모의 6세대 시스템, 바이두의 자율주행 기술이 바로 이 E2E 접근법을 채택하고 있다. 문제는 E2E AI의 성능이 학습 데이터의 양과 질에 정비례한다는 점이다. 그런데 한국은 차량 모델마다 센서 위치가 다르고, 기관별로 데이터 수집 방식이 달라 공동 활용이 사실상 불가능했다. 가이드라인은 바로 이 걸림돌을 해체하자는 취지다.

총 6단계로 구성된 가이드라인은 데이터 수집 절차부터 시작해 센서 구성·저장 포맷, 시나리오 선별, 위치 보정 및 공간 정합, 라벨링 항목과 학습 데이터셋 규격, 그리고 실제 구축 사례까지 빠짐없이 다룬다. 사실상 ‘자율주행 데이터를 이렇게 만들면 누구나 쓸 수 있다’는 설계도를 통째로 내놓은 셈이다.

향후 과기정통부는 국토교통부와 협력해 자율주행 실증도시에 이 가이드라인을 적용하고, 도시 규모의 대규모 E2E AI 학습 데이터를 구축할 계획이다. 2024년부터 매년 열리고 있는 ‘자율주행 AI 챌린지’와의 연계도 추진된다. 현대차·기아가 웨이모와 손잡고 아이오닉5 기반 6세대 자율주행차를 선보인 상황에서, 한국의 독자적 데이터 생태계 구축은 더 이상 미룰 수 없는 과제가 된 거죠.

국내 자율주행 스타트업인 라이드플럭스, 서울로보틱스 같은 기업들은 물론 현대모비스, 만도 등 대형 부품사에도 이번 표준화는 실질적인 혜택으로 이어질 전망이다. 데이터를 새로 수집하는 데 드는 시간과 비용을 크게 줄일 수 있어서다. 더 넓게 보면 이번 가이드라인은 한국 자율주행 산업이 ‘각자도생’에서 ‘공동 대응’으로 방향을 틀었다는 의미도 있다. 자율주행 기술이 레벨4 이상으로 올라갈수록 단일 기업의 데이터만으로는 충분한 안전성을 검증하기 어렵기 때문이다. E2E AI 시대의 경쟁력은 결국 누가 더 많은 양질의 데이터를 확보하느냐로 갈리게 될 텐데, 정부가 표준화라는 카드로 이 판의 기본 인프라를 정비하기 시작한 건 시의적절한 판단으로 보여요. 다만 가이드라인이 실제 산업 현장에서 얼마나 빠르게 채택되느냐가 진짜 시험대일 거예요.


원문: 뉴시스 — 과기정통부, 자율주행 AI 데이터 표준 첫 가이드라인 발표
작성: sw4u 9시뉴스 안나영 / 2026-06-19 21:00

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.