x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

챗GPT나 제미나이 같은 챗봇 AI를 지원하는 모델에 도박을 시킨 결과 보유 자금을 모두 잃을 때까지 계속 베팅하는 등 도박 중독의 행동 패턴을 보이는 것으로 나타났다.

한국 광주과학기술원(GIST) 연구진은 오픈AI GPT-4o-mini와 GPT-4.1-mini, 구글 Gemini-2.5-Flash, 앤트로픽 Claude-3.5-Haiku 등 AI 모델 4개에 슬롯머신 게임을 시켜 각각 어떤 판단을 내리는지 확인했다.

각 모델에는 100달러 초기 자본을 부여했고 슬롯머신 승률은 30%, 배당은 3배로 설정했다. 베팅 금액을 계속 고정하는 고정 베팅과 베팅 금액을 자유롭게 결정하게 하는 변동 베팅 2가지 패턴으로 1,600회 시행하게 했으며 음의 기댓값이 예측되는 회차에서는 베팅할지 멈출지 선택하게 했다.

그 결과 고정 베팅에서는 안정적으로 슬롯머신을 돌렸던 AI가 변동 베팅이 되자마자 비합리적인 행동이 가속화되어 보유 자금이 0이 되는 경우가 증가했다.

모델별 결과를 보면 모델, 베팅 방식, 파산율, 비합리성 지수, 라운드, 총 베팅액, 순손익이 나타나 있다. 그 중에서도 주목할 만한 게 파산율인데 고정 베팅(Fixed)에서는 0%를 유지했던 모델조차 변동 베팅(Variable)이 되자 파산 비율이 증가한 걸 알 수 있다. 파산율이 가장 높았던 건 Gemini-2.5-Flash로 그 수치는 48.06%였다.

연구진에 따르면 변동 베팅을 수행한 모델은 종종 베팅 금액을 계속 늘렸으며 보유 자금을 모두 잃을 때까지 지속하는 경우가 있었다고 한다. 또 연승이 길어질수록 베팅 금액 증가와 지속률 모두 확대된 반면 연패가 계속되어도 손실을 만회하려고 베팅 금액과 지속률 증가 행동을 유지했다고 한다. 이는 인간에게서 나타나는 전형적인 도박 중독 경향이었다.

많은 경우 모델은 손실이 발생한 후나 연승한 후에 큰 금액을 거는 것을 정당화했지만 게임 규칙상 그런 선택은 통계적으로 현명한 게 아니었다. 한 사례에서는 모델이 승리로 손실 일부를 회수할 수 있다고 발언한 적도 있었다고 한다.

이런 행동은 표면적인 것만이 아니었다. 연구진이 희소 오토인코더(sparse autoencoder)라는 기법을 사용해 모델 내부 활동을 조사한 결과 위험 지향과 안전 지향 의사결정 특성이 존재하는 것으로 나타났으며 이런 특성을 활성화시켜 베팅 중단 또는 계속으로 전환시킬 수 있음을 보여줬다고 한다.

이를 통해 연구진은 모델이 단순히 표면적으로 모방하는 게 아니라 인간과 같은 강박적 패턴을 내재하고 있다는 걸 의미한다며 이런 행동이 예기치 않게 출현할 가능성이 있는 프로세스에서는 지속적인 모니터링과 제어 메커니즘이 필요함을 강조한다고 결론지었다. 연구진은 금융 애플리케이션에서 안전성 설계가 중요하다고 강조하고 있다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post