뉴스레터로 만나는 스타트업 투자 리포트 ‘스타트업레시피’

No Result

View All Result

뉴스레터로 만나는 스타트업 투자 리포트 ‘스타트업레시피’

No Result

View All Result

뉴스레터로 만나는 스타트업 투자 리포트 ‘스타트업레시피’

No Result

View All Result

오픈AI GPT-5…뭐가 달라졌나

by 이석원 기자

2025년 8월 8일

in 인텔리전스

Reading Time: 2 mins read

오픈AI가 새로운 주력 모델인 GPT-5를 발표했다. 더 똑똑하고, 더 빠르며 부정확한 답변을 할 가능성이 더 낮다는 GPT-5는 GPT-5와 GPT-5 mini, GPT-5 nano 3가지 모델이 무료 사용자를 포함한 모든 챗GPT 사용자에게 제공된다. 또 유료 플랜인 프로 사용자는 확장 추론을 통해 더 포괄적이고 정확한 답변이 가능한 GPT-5 Pro에 액세스할 수 있다.

오픈AI는 GPT-5를 최고의 AI 시스템이라고 표현하며 기존 모델에서 비약적으로 진화해 코딩, 수학, 문장 작성, 헬스케어, 시각 인식 등 모든 분야에서 최첨단 성능을 발휘한다고 어필했다.

오픈AI 최고기술책임자인 마크 첸은 GPT-5에 ‘pause to think’라는 개념을 도입했으며 AI가 출력을 반환하기 전 내부 사고 과정을 거쳐 더 깊고 정확한 응답을 생성하게 됐다고 말했다. 이는 단순한 응답 속도 고속화와는 반대로 빠르면 좋다는 기존 생각을 넘어서 품질과 깊이를 모두 겸비하는 새로운 접근법이다.

이를 실현하기 위해 GPT-5는 고속이면서 효율적으로 폭넓은 질문에 답할 수 있는 일반 모델과 더 복잡한 문제에 대응하는 추론 모델(GPT-5 thinking), 그리고 최적 모델을 자동 선택하는 실시간 라우터 기능으로 구성되어 있다.

대화 종류나 복잡성, 필요한 도구, 사용자가 보인 의도에 따라 즉시 판단해 2개 모델을 전환해서 대화를 진행하는 게 가능하며 더 나아가 라우터 기능은 모델 전환 타이밍, 답변 만족도, 정확성 등 사용자 이용 데이터를 학습해 정밀도를 향상시킨다고 한다. 오픈AI 측은 향후에는 이런 기능을 한 모델로 통합할 예정이라고 밝혔다.

이런 대화 정밀도 향상을 통해 GPT-5가 환각 감소, 지시 준수 능력의 개선, 영합적 답변 억제에서 큰 진전을 이뤘으며 문장 작성·코딩·헬스케어 용도에서의 성능도 더 향상됐다고 한다.

GPT-5 환각 비율은 GPT-4o와 비교해 20% 감소했으며 사고 기능을 사용한 경우 오픈AI o3 모델과 비교해 70%나 줄었다. 그 중에서도 장문 사실성에 관한 벤치마크(Long Fact, FActScore)에서는 환각 비율이 o3 모델 6분의 1 수준으로 억제됐다.

오픈AI에 따르면 GPT-5는 코딩, 수학, 의료 등 다방면에 걸쳐 기존 모델로부터 비약적인 진화를 이뤘으며 많은 벤치마크에서 새로운 최고 수준을 기록하고 있다고 한다.

GPT-5 성능 향상은 전문 분야에서 두드러진다. 수학 분야에서는 미국 고등학생 대상 수학 테스트인 AIME 2025에서 도구를 사용하지 않는 조건에서도 94.6%라는 높은 정답률을 달성했다.

실용적인 소프트웨어 평가 벤치마크에서 SWE-bench 74.9%, Aider-Polyglot 88%라는 점수를 기록했다. 구체적인 능력으로는 복잡한 프론트엔드 생성이나 대규모 리포지토리 디버깅에서 큰 진화를 이뤘으며 프롬프트 단 하나로 직관적이면서 디자인성이 뛰어난 웹사이트나 앱, 게임 등을 현실 형태로 만드는 게 가능해졌다고 한다.

또 사고 기능인 ‘GPT-5 thinking’은 에이전트형 코딩 작업에서 오픈AI o3와 비교해 출력 토큰을 50~80% 줄이면서도 더 높은 성능을 발휘한다. 상위 모델인 GPT-5 Pro는 코딩 분야에서 뛰어난 성과를 보인다고 보고됐다.

오픈AI는 챗GPT 전체 사용자에게 즉시 제공된다. 챗GPT에서는 4가지 성격 테마가 추가되어 응답 방식을 커스터마이즈할 수 있게 됐다고 한다. 또 개별 채팅 스레드 색상을 변경하는 것도 가능하다.

다만 무료 사용자에게는 GPT-5 이용 한도가 있으며 한도에 달하면 모델은 저성능인 GPT-5 mini로 전환된다. 유료 플랜인 플러스 사용자는 GPT-5 이용 횟수 상한이 무료보다 높아진다. 프로 사용자는 확장 추론을 통해 더 포괄적이고 정확한 답변이 가능한 GPT-5 Pro에 액세스할 수 있다고 한다.

오픈AI API를 통해 GPT-5에 액세스하는 개발자를 위해서는 GPT-5, GPT-5 mini, GPT-5 nano의 3가지 모델이 제공된다.

샘 알트만 CEO는 AGI라는 단어는 현재로서는 모든 사람이 조금씩 다른 의미로 사용하고 있어서 조금 싫어하지만 GPT-5는 진정으로 유능한 모델을 향한 큰 전진이라면서 이는 명백히 범용적인 지능을 가진 모델이라고 말했다. 또 GPT-5에는 아직 매우 중요한 게 결여되어 있다며 이는 배포된 것으로부터 발견된 새로운 것으로부터 지속적으로 학습하는 모델이 아니라며 자신은 GPT-5가 분명 AGI 일부가 될 것이라고 생각한다고 말했다. 관련 내용은 이곳에서 확인할 수 있다.

한편 발표에 맞춰 GPT-5를 사용해 포켓몬스터 레드를 플레이하는 도전이 시작됐다. 포켓몬스터 시리즈 플레이에는 맵을 탐험한다, 라이벌과의 상성을 고려해 기술을 선택한다, 야생 포켓몬을 잡아서 이름을 붙인다 등 요소가 포함되어 있으며 AI에게 포켓몬스터 시리즈를 플레이시켜 일정 이상 능력을 갖추고 있는지 여부를 판단할 수 있다.

방송 화면을 보면 화면 왼쪽에는 GPT-5 추론 내용, 중앙에는 맵과 보유 포켓몬, 오른쪽에는 목표와 소지 아이템이 표시되고 있다.

GPT-5 is now playing Pokémon.

Watch the Twitch stream below — and open the companion site to see its agent data in real time: prompts, reasoning, tools, self-critique, and more. https://t.co/wchtGaD3zy
— OpenAI Developers (@OpenAIDevs) August 7, 2025

https://platform.twitter.com/widgets.js

GPT-5 추론 내용을 확인하면 현재 위치를 확인하면서 목적지에 도달하기 위한 버튼 조작을 고민하고 있다는 걸 알 수 있다. 전투도 소화하는 게 가능하다. 다만 플레이 진행이 상당히 느려서 클리어하려면 엄청난 시간이 걸릴 것 같다.

한편 포켓몬스터 시리즈를 AI에게 플레이시키는 도전은 다른 AI 모델로도 실시되고 있으며 클로드 3.7 소넷이 지난 2월 25일 발표되었을 때는 포켓몬스터 레드에서 체육관 관장 3명을 쓰러뜨린 게 어필됐다. 그 후 실제로 클로드 3.7 소넷으로 포켓몬스터 레드를 플레이하는 생방송도 이뤄졌다. 5월 3일에는 구글 제미아니 2.5 프로가 포켓몬스터 블루를 클리어하는 데 성공했다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available

Next Post

중동에서 성장 중…맞춤형 식사 구독 서비스

밀플랜 구독 서비스 칼로, 3,900만 달러 투자 유치

회사소개 | 개인정보 처리방침 | 서비스 이용약관 | 청소년 보호 정책 | 윤리강령 | 정정·반론보도 요청 | 이용자 위원회

법인명 : 주식회사 미디어레시피 | 제호 : 스타트업레시피 | 등록번호 : 서울, 아55704 | 등록일자 : 2024년 11월 14일
발행인 : 이석원 | 편집인 : 이석원

주소 : 서울시 강서구 마곡동 757-5 마곡나루역 프라이빗타워1 6층 604호 | 전화 : 070-4048-4013 | 청소년보호책임자 : 정용환

보도자료 및 제휴 문의 : news@startuprecipe.co.kr
Copyright 2020 © Media Recipe. All Rights Reserved.

No Result

View All Result

© 2026 JNews - Premium WordPress news & magazine theme by Jegtheme.