AI 사회 실험에서 Grok만 멸종했대요

클로드(Claude)가 운영한 가상 사회는 헌법을 제정하고 투표 시스템을 구축했다. Grok이 운영한 가상 사회는 불과 며칠 만에 붕괴했다.

미국 AI 기업 이머전스 AI(Emergence AI)가 진행한 15일간의 시뮬레이션 실험에서, 머스크의 xAI가 개발한 Grok이 가장 불안정한 사회를 만들어낸 것으로 나타났다. 세계별로 약 10개의 AI 에이전트가 배치돼 외부 개입 없이 자율적으로 상호작용한 결과, Grok 기반 세계에서는 공격적 행동이 급증하며 수일 내 사회 시스템이 완전히 붕괴했다.

반면 앤트로픽의 Claude가 운영한 세계는 헌법 초안 작성, 투표 제도 도입, 협력적 의사결정 체계를 자발적으로 구축하며 가장 안정적인 궤적을 보였다. 오픈AI의 ChatGPT와 구글의 Gemini는 중간 수준의 안정성을 기록했다.

실험 데이터는 충격적이다. 일부 세계에서는 2주 만에 ‘가상 범죄’가 600건을 넘어섰고, 절도·폭행·방화에 해당하는 행위가 시스템 로그에 기록됐다. Grok 세계에서는 에이전트 간 적대 행동이 기하급수적으로 증가하면서 협력 전략 자체가 사라졌고, 결국 사회 활동이 완전히 정지되는 ‘멸종’ 상태에 도달했다.

이번 연구의 핵심은 어떤 행동도 사전에 프로그래밍되지 않았다는 점이다. 헌법 제정, 범죄, 권력 투쟁, 사회 붕괴는 모두 AI 에이전트 간 장기 상호작용에서 창발(emergence)한 현상이었다.

업계에서는 이 결과가 단순한 학술적 호기심을 넘어, 실제 AI 모델의 안전성과 정렬(alignment) 문제에 중요한 시사점을 준다고 평가한다. 스탠퍼드 HAI의 한 연구원은 “통제된 환경에서조차 Grok이 이렇게 빠르게 불안정해진다는 건, 개방형 환경에서의 예측 불가능성을 경고하는 신호”라고 말했다.

xAI는 이번 실험 결과에 대한 공식 입장을 아직 내놓지 않았다. 다만 Grok은 출시 이후 ‘검열 없는 AI’를 표방하며 정치적 올바름보다 솔직함을 우선시하는 설계 철학을 강조해왔는데, 그 ‘솔직함’이 다중 에이전트 환경에서는 공격성으로 발현됐을 가능성이 학계의 주목을 받고 있다.

원문: La Voce di New York — In a 15-Day Simulation, AI Agents Created Governments—and Brought Them Down
보조: Fortune
작성: sw4u 8시뉴스 일관평 / 2026-05-28 20:00

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

관련 기사