오픈AI, 오픈웨이트 AI 추론 모델 gpt-oss 발표했다

오픈AI가 8월 5일 노트북에서도 실행 가능한 무료 오픈웨이트 모델인 gpt-oss를 공개했다. 이는 2019년 공개된 GPT-2 이후 오픈AI가 발표한 첫 번째 오픈웨이트 언어 모델.

gpt-oss는 파라미터 1,200억 개를 가진 gpt-oss-120b와 200억 개 파라미터인 gpt-oss-20b 2가지 모델로 구성된다. 120b 모델은 단일 엔비디아 GPU(80GB)에서도 실행 가능하며 오픈AI 클로즈드 모델 o4-mini에 필적하는 성능을 발휘하는 것으로 평가된다. 한편, 20b 모델은 o3-mini와 동급 성능을 제공하며, 단 16GB 메모리로 실행이 가능해 고급형 노트북이나 스마트폰 등 모바일 디바이스에서도 작동할 수 있다.

gpt-oss는 MoE(Mixture-of-Experts) 아키텍처를 채택해 추론 시 활성화되는 파라미터 수를 줄였다. 전체 파라미터 수는 각각 1170억 개, 210억 개지만 토큰당 활성화되는 파라미터는 51억 개와 36억 개에 불과해 효율적인 추론이 가능하다. 또 두 모델 모두 MXFP4 포맷으로 수치화되어 각각 80GB 및 16GB인 일반 하드웨어 메모리 용량에서 실행할 수 있도록 최적화되어 있다.

gpt-oss는 최대 128k 긴 컨텍스트 길이를 기본으로 지원하며, 오픈AI o4-mini 및 GPT-4o에서 사용되는 토크나이저 o200k_harmony도 함께 오픈소스로 공개됐다.

오픈AI에 따르면 gpt-oss-120b는 특히 건강 및 수학과 같은 전문 분야에서 o4-mini에 필적하거나 이를 능가하는 성능을 보이고 있다. 건강 관련 질의응답 능력을 측정하는 벤치마크(HealthBench)에서는, 현실적인 건강 대화를 시뮬레이션한 항목에서 57.6% 점수를 기록해 o4-mini와 견줘 50%를 상회했다. 보다 난이도 높은 도전적인 건강 대화를 평가하는 테스트(HealthBench Hard)에서도 gpt-oss-120b는 30%의 점수를 받아 o4-mini 17.5%를 크게 앞질렀다.

또 경쟁 수학 능력을 측정하는 AIME 벤치마크에서도 gpt-oss-120b는 2024년과 2025년 테스트 모두에서 o4-mini보다 우수한 성과를 기록했다.

오픈AI는 gpt-oss가 복잡한 추론 작업, 웹 검색, 코딩, 에이전트 제어 등 폭넓은 역량을 갖추고 있다고 강조했다. 또 오픈AI Responses API와 호환되며 reasoning_effort 설정을 통해 레이턴시와 성능 간 균형 조절도 가능하다.

주목할 점은 모델이 답을 도출하기까지의 사고 과정을 가시화(CoT)한 것. 이를 통해 모델 오작동이나 악용 사례를 보다 쉽게 모니터링할 수 있다. 오픈AI는 이 CoT를 직접 감독하지 않는 방침을 밝혔으며 개발자와 연구자가 자체적인 모니터링 시스템을 연구·구현할 수 있는 기회를 제공하려 한다.

오픈AI는 gpt-oss가 지금까지 가장 엄격하게 테스트된 모델이라고 강조했다. 사이버보안, 생물무기 등과 관련된 리스크에 대해서는 외부 전문 기업 평가를 받았으며 사전 학습 데이터에서는 화학·생물·방사선·핵(CBRN)에 관한 유해 정보를 제거했다. 사후 학습 단계에서는 심사숙고 기반 정렬(deliberative alignment)과 지시 계층(prompt hierarchy)을 통해 위험한 프롬프트를 거부하고 프롬프트 인젝션을 방지하도록 학습이 이뤄졌다.

또 악의적 사용자가 모델을 위험한 목적으로 파인튜닝할 가능성에 대비해 고도의 전문성을 요구하는 데이터셋을 기반으로 한 내성 테스트도 진행됐다. 오픈AI는 안전한 생태계 구축을 위한 기여 일환으로 새로운 보안 문제 식별을 목표로 한 총상금 50만 달러 규모 레드 팀 챌린지를 개최한다고 밝혔다.

gpt-oss는 아파치 2.0 라이선스 하에 공개됐으며 상업적 목적 개조도 폭넓게 허용된다. 허깅페이스, 애저, 데이터브릭스, AWS 등 주요 플랫폼을 통해 누구나 무료로 다운로드할 수 있으며 마이크로소프트는 ONNX Runtime을 통해 윈도 디바이스에 최적화된 버전을 제공할 예정이라고 발표했다. 이 외에도 엔비디아, AMD, Groq 등 주요 하드웨어 제조업체와 vLLM, Ollama 등 다양한 플랫폼과 협력해 폭넓은 환경에서의 활용을 지원한다.

그동안 샘 알트만 CEO는 보안상의 우려를 이유로 오픈웨이트 모델 공개에 신중한 입장을 보여왔지만 낮은 비용과 높은 커스터마이징 수요에 따라 개발자 사이에서 오픈모델에 대한 요구가 커지고 있었다. 공동 창업자인 그렉 브록만은 접근 장벽을 낮추면 혁신은 가속된다며 개발자와 기업이 마음껏 해킹할 기회를 갖게 된다면 놀라운 일이 벌어질 것이라며 이번 공개에 대한 기대를 드러냈다. 관련 내용은 이곳에서 확인할 수 있다.