KAIST 비전 AI, 구글 알고리즘 20% 추월했네요

“‘이미지를 16배 압축해서 쓰니까 해상도가 많이 떨어지거든요.’ KAIST 연구실에서 시작된 이 고민이 결국 구글의 최신 컴퓨터 비전 알고리즘을 20% 이상 뛰어넘는 성과로 이어졌어요.”

KAIST 전기및전자공학부 김창익 교수 연구팀이 MIT·마이크로소프트 연구진과 공동으로 ‘업샘플 애니띵(Upsample Anything)’을 개발했다고 17일 밝혔어요. 이 기술은 제한된 GPU 메모리만으로 저해상도 이미지를 고해상도로 복원하는 게 핵심이에요.

성능은 이미 세계 최고 수준에서 검증됐어요. 지난주 열린 컴퓨터비전 분야 최고 학회 ‘CVPR 2026’에서 전체 논문 중 최고를 뜻하는 ‘CVPR 컴퓨트 골드 스타’를 수상했고, 연구 투명성 부문 ‘트랜스패런시 챔피언’에도 선정됐어요. 구글이 최근 선보인 유사 알고리즘보다 최소 20% 이상 우수하다는 게 연구진 설명이에요.

어떻게 이게 가능했을까요. 연구팀은 학습이 아예 필요 없는 ‘테스트 시점 최적화(TTO)’ 방식을 택했어요. 기존에 값비싼 GPU로 수백 번 연산하던 작업을 픽셀별 적응형 가우시안 커널 하나로 대체한 거예요. 224×224 해상도 기준 0.4초, 1000×1000 해상도에서도 3초면 동작하고, 메모리 사용량은 기존 방식의 16분의 1에 불과해요.

논문 제1저자인 서민석 박사과정생은 “자율주행 중 글자를 읽거나 제조공정에서 흠집을 잡아내는 일이 생각보다 어려운데, 이 기술이 그 간극을 메워줄 것”이라고 말했어요.

김창익 교수는 “적은 메모리 자원으로도 AI 시각 정밀도를 크게 높인 알고리즘”이라며 “휴머노이드 로봇과 온디바이스 AI 실용화를 앞당길 것”이라고 기대했어요.

한국의 대학 연구실이 내놓은 성과가 글로벌 빅테크의 최신 기술을 추월한 건 흔치 않은 그림이에요. 특히 이번 연구는 CVPR이라는 최정상급 학회에서 ‘최고’ 타이틀을 동시에 두 개나 거머쥐었다는 점에서 더 의미가 있어요. AI 경쟁력이 모델 크기나 데이터 규모로만 결정되지 않고, 알고리즘의 우아함과 효율성에서도 차이가 난다는 걸 보여준 사례거든요.

CVPR는 매년 1만 편 가까운 논문이 투고되는 컴퓨터비전 분야 최대 학회예요. 그 무대에서 ‘골드 스타’를 받았다는 건 연구의 독창성과 실용성을 동시에 인정받았다는 뜻이에요. 특히 올해는 구글·메타·오픈AI 같은 빅테크 연구소의 논문 비중이 사상 최대였던 해라, 대학 연구실 주도의 성과가 더 돋보였어요.

업계에선 온디바이스 AI 시장이 본격적으로 열리는 지금, 이런 ‘가벼운 고성능’ 알고리즘이 더 중요해질 거라고 봐요. 현재 휴머노이드 로봇 한 대에 탑재되는 비전 처리용 GPU만 해도 수백만 원대예요. 이 비용을 크게 낮추지 않으면 로봇의 대중화는 요원하거든요.

자율주행 카메라, 협동로봇의 비전 센서, 스마트폰 카메라까지 — GPU 의존도를 낮추면서 정밀도는 높이는 기술이 필요한 곳은 계속 늘어나고 있어요. KAIST 연구팀이 연내 후속 버전에서 동영상 실시간 업샘플링까지 확장하겠다고 밝힌 만큼, 앞으로 몇 달간의 진척이 주목돼요. 한국 연구진이 CVPR 최고상을 거머쥔 일이 2023년 이후 두 번째라는 점도 이번 성과의 무게를 더해줘요.

원문: ZDNet Korea — KAIST-MIT-마이크로소프트 “비전 알고리즘 구글 대비 성능 20% 개선”
작성: sw4u 9시뉴스 안나영 / 2026-06-17 09:00

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

관련 기사