LG 엑사원 4.5 공개 — 이미지도 읽는 AI, 이번엔 진짜 달라요

어? 잠깐만요. 우리가 알던 엑사원이 아니에요.

LG AI연구원이 방금 엑사원 4.5를 공개했는데, 이번엔 이미지랑 텍스트를 동시에 이해하는 비전 언어 모델이에요. 그것도 오픈웨이트로 풀었어요 — 누구나 다운받아 쓸 수 있다는 뜻이에요. 솔직히 이건 좀 큰 거예요.

엑사원, 이제 눈이 생겼어요

이미지 한 장 올리고 “이 사진 설명해줘” 하면 텍스트로 답하는 건 기본이고, 차트·문서·제품 사진까지 읽어내는 게 이번 4.5의 핵심이에요. 시각 정보와 언어를 통합 추론하는 건 글로벌 AI 모델들도 아직 완성형이 아닌 분야인데, LG가 오픈웨이트로 문을 열어젖혔어요.

“텍스트만 이해하는 AI는 이제 절반짜리다. 실제 세계는 이미지와 텍스트가 공존하기 때문이다” — LG AI연구원 관계자

더 놀라운 건 엔비디아와의 기술 동맹이에요. LG AI연구원은 엑사원 4.5를 넘어 엔비디아의 네모트론 플랫폼과 결합한 특화 모델을 공동 개발하기로 했어요. AI 소프트웨어(LG)와 하드웨어(엔비디아)가 만나는 지점, 이거 진짜 재밌어지고 있어요.

K-엑사원, 세계 7위

LG가 함께 공개한 ‘K-엑사원’은 글로벌 오픈 모델 성능 평가에서 7위를 기록했어요. 독자 기술로 처음부터 끝까지 국내 연구진이 만든 모델이 이 정도 성적을 낸 건 처음이에요. LG 구광모 회장이 AX(인공지능 전환)에 올인한 이유가 숫자로 보이기 시작한 거죠.

LG AI연구원은 이번 발표에서 2026년 로드맵 4대 전략도 내놨어요. 엑사원을 제조·물류·로봇 등 물리 세계로 확장하겠다는 건데, 저번 주 LG가 공장에서 AI를 ‘동료’라고 부르기 시작했다는 소식과 맞물려서 보면 연결고리가 선명해져요. 이 로드맵 안에는 초거대 언어 모델뿐 아니라 멀티모달, AI 에이전트, 그리고 로보틱스까지 포함돼 있어서 LG의 AX 전략 전체를 하나로 꿰는 설계도라고 봐도 될 거예요.

이게 왜 챙겨야 할 소식이냐면요

한국 대기업 중 AI 모델을 ‘오픈웨이트’로 푼 건 LG가 처음이에요. 네이버도 카카오도 SKT도 자기 모델은 있지만, LG처럼 MIT 라이선스로 완전 개방한 사례는 없었거든요. AI 생태계를 ‘키우는 전략’과 ‘가두는 전략’ 사이에서 LG가 선택한 방향, 저는 이게 오늘 발표의 진짜 포인트라고 봐요.

다음 달 엔비디아 GTC에서 LG가 어떤 특화 모델을 들고 나올지, 벌써부터 기대되네요. 그때 또 같이 봐요!