
오픈AI가 새로운 주력 모델인 GPT-5를 발표했다. 더 똑똑하고, 더 빠르며 부정확한 답변을 할 가능성이 더 낮다는 GPT-5는 GPT-5와 GPT-5 mini, GPT-5 nano 3가지 모델이 무료 사용자를 포함한 모든 챗GPT 사용자에게 제공된다. 또 유료 플랜인 프로 사용자는 확장 추론을 통해 더 포괄적이고 정확한 답변이 가능한 GPT-5 Pro에 액세스할 수 있다.
오픈AI는 GPT-5를 최고의 AI 시스템이라고 표현하며 기존 모델에서 비약적으로 진화해 코딩, 수학, 문장 작성, 헬스케어, 시각 인식 등 모든 분야에서 최첨단 성능을 발휘한다고 어필했다.

오픈AI 최고기술책임자인 마크 첸은 GPT-5에 ‘pause to think’라는 개념을 도입했으며 AI가 출력을 반환하기 전 내부 사고 과정을 거쳐 더 깊고 정확한 응답을 생성하게 됐다고 말했다. 이는 단순한 응답 속도 고속화와는 반대로 빠르면 좋다는 기존 생각을 넘어서 품질과 깊이를 모두 겸비하는 새로운 접근법이다.
이를 실현하기 위해 GPT-5는 고속이면서 효율적으로 폭넓은 질문에 답할 수 있는 일반 모델과 더 복잡한 문제에 대응하는 추론 모델(GPT-5 thinking), 그리고 최적 모델을 자동 선택하는 실시간 라우터 기능으로 구성되어 있다.
대화 종류나 복잡성, 필요한 도구, 사용자가 보인 의도에 따라 즉시 판단해 2개 모델을 전환해서 대화를 진행하는 게 가능하며 더 나아가 라우터 기능은 모델 전환 타이밍, 답변 만족도, 정확성 등 사용자 이용 데이터를 학습해 정밀도를 향상시킨다고 한다. 오픈AI 측은 향후에는 이런 기능을 한 모델로 통합할 예정이라고 밝혔다.

이런 대화 정밀도 향상을 통해 GPT-5가 환각 감소, 지시 준수 능력의 개선, 영합적 답변 억제에서 큰 진전을 이뤘으며 문장 작성·코딩·헬스케어 용도에서의 성능도 더 향상됐다고 한다.
GPT-5 환각 비율은 GPT-4o와 비교해 20% 감소했으며 사고 기능을 사용한 경우 오픈AI o3 모델과 비교해 70%나 줄었다. 그 중에서도 장문 사실성에 관한 벤치마크(Long Fact, FActScore)에서는 환각 비율이 o3 모델 6분의 1 수준으로 억제됐다.
오픈AI에 따르면 GPT-5는 코딩, 수학, 의료 등 다방면에 걸쳐 기존 모델로부터 비약적인 진화를 이뤘으며 많은 벤치마크에서 새로운 최고 수준을 기록하고 있다고 한다.
GPT-5 성능 향상은 전문 분야에서 두드러진다. 수학 분야에서는 미국 고등학생 대상 수학 테스트인 AIME 2025에서 도구를 사용하지 않는 조건에서도 94.6%라는 높은 정답률을 달성했다.

실용적인 소프트웨어 평가 벤치마크에서 SWE-bench 74.9%, Aider-Polyglot 88%라는 점수를 기록했다. 구체적인 능력으로는 복잡한 프론트엔드 생성이나 대규모 리포지토리 디버깅에서 큰 진화를 이뤘으며 프롬프트 단 하나로 직관적이면서 디자인성이 뛰어난 웹사이트나 앱, 게임 등을 현실 형태로 만드는 게 가능해졌다고 한다.
또 사고 기능인 ‘GPT-5 thinking’은 에이전트형 코딩 작업에서 오픈AI o3와 비교해 출력 토큰을 50~80% 줄이면서도 더 높은 성능을 발휘한다. 상위 모델인 GPT-5 Pro는 코딩 분야에서 뛰어난 성과를 보인다고 보고됐다.
오픈AI는 챗GPT 전체 사용자에게 즉시 제공된다. 챗GPT에서는 4가지 성격 테마가 추가되어 응답 방식을 커스터마이즈할 수 있게 됐다고 한다. 또 개별 채팅 스레드 색상을 변경하는 것도 가능하다.
다만 무료 사용자에게는 GPT-5 이용 한도가 있으며 한도에 달하면 모델은 저성능인 GPT-5 mini로 전환된다. 유료 플랜인 플러스 사용자는 GPT-5 이용 횟수 상한이 무료보다 높아진다. 프로 사용자는 확장 추론을 통해 더 포괄적이고 정확한 답변이 가능한 GPT-5 Pro에 액세스할 수 있다고 한다.
오픈AI API를 통해 GPT-5에 액세스하는 개발자를 위해서는 GPT-5, GPT-5 mini, GPT-5 nano의 3가지 모델이 제공된다.
샘 알트만 CEO는 AGI라는 단어는 현재로서는 모든 사람이 조금씩 다른 의미로 사용하고 있어서 조금 싫어하지만 GPT-5는 진정으로 유능한 모델을 향한 큰 전진이라면서 이는 명백히 범용적인 지능을 가진 모델이라고 말했다. 또 GPT-5에는 아직 매우 중요한 게 결여되어 있다며 이는 배포된 것으로부터 발견된 새로운 것으로부터 지속적으로 학습하는 모델이 아니라며 자신은 GPT-5가 분명 AGI 일부가 될 것이라고 생각한다고 말했다. 관련 내용은 이곳에서 확인할 수 있다.
한편 발표에 맞춰 GPT-5를 사용해 포켓몬스터 레드를 플레이하는 도전이 시작됐다. 포켓몬스터 시리즈 플레이에는 맵을 탐험한다, 라이벌과의 상성을 고려해 기술을 선택한다, 야생 포켓몬을 잡아서 이름을 붙인다 등 요소가 포함되어 있으며 AI에게 포켓몬스터 시리즈를 플레이시켜 일정 이상 능력을 갖추고 있는지 여부를 판단할 수 있다.
방송 화면을 보면 화면 왼쪽에는 GPT-5 추론 내용, 중앙에는 맵과 보유 포켓몬, 오른쪽에는 목표와 소지 아이템이 표시되고 있다.
https://platform.twitter.com/widgets.jsGPT-5 is now playing Pokémon.
— OpenAI Developers (@OpenAIDevs) August 7, 2025
Watch the Twitch stream below — and open the companion site to see its agent data in real time: prompts, reasoning, tools, self-critique, and more. https://t.co/wchtGaD3zy
GPT-5 추론 내용을 확인하면 현재 위치를 확인하면서 목적지에 도달하기 위한 버튼 조작을 고민하고 있다는 걸 알 수 있다. 전투도 소화하는 게 가능하다. 다만 플레이 진행이 상당히 느려서 클리어하려면 엄청난 시간이 걸릴 것 같다.
한편 포켓몬스터 시리즈를 AI에게 플레이시키는 도전은 다른 AI 모델로도 실시되고 있으며 클로드 3.7 소넷이 지난 2월 25일 발표되었을 때는 포켓몬스터 레드에서 체육관 관장 3명을 쓰러뜨린 게 어필됐다. 그 후 실제로 클로드 3.7 소넷으로 포켓몬스터 레드를 플레이하는 생방송도 이뤄졌다. 5월 3일에는 구글 제미아니 2.5 프로가 포켓몬스터 블루를 클리어하는 데 성공했다. 관련 내용은 이곳에서 확인할 수 있다.

