앤트로픽, 클로드 미토스 프리뷰 제공 시작

앤트로픽이 4월 7일 클로드 미토스 프리뷰(Claude Mythos Preview)를 일부 조직을 대상으로 제공 개시했다고 발표했다. 클로드 미토스 프리뷰는 소프트웨어 취약점을 발견해 악용하는 능력이 극히 높으며 이미 리눅스와 오픈BSD에 존재하는 중대한 취약점을 대량 발견했다. 앤트로픽은 AI 발전에 따른 보안 리스크 증가에 대응하기 위해 마이크로소프트, 애플, 리눅스재단(Linux Foundation) 등 조직을 지원하는 프로젝트 글래스윙(Project Glasswing)도 시작했다.

코딩 에이전트 성능을 비교한 결과 클로드 미토스 프리뷰는 클로드 오퍼스 4.6에 비해 성능이 비약적으로 향상됐으며 추론 성능, PC 자동 조작 성능도 향상됐다.

앤트로픽은 클로드 미토스 프리뷰가 지닌 특징으로 소프트웨어 취약점을 발견해 악용하는 능력이 높다는 점을 꼽았다. 앤트로픽에 따르면 클로드 미토스 프리뷰의 취약점 발견 능력은 극소수 인간을 제외하고 대다수 인간을 능가하는 수준에 달했다고 한다.

클로드 소넷 4.6, 클로드 오퍼스 4.6, 클로드 미토스 프리뷰로 파이어폭스 취약점을 악용해 익스플로잇을 작성하는 태스크를 실행한 결과 클로드 소넷 4.6과 클로드 오퍼스 4.6에서는 실패가 대부분을 차지했지만 클로드 미토스 프리뷰는 실행 가능한 익스플로잇을 72.4%라는 높은 비율로 작성했다.

더 나아가, 클로드 미토스 프리뷰는 실제 운영 중인 소프트웨어에서 수천 건에 달하는 취약점을 발견하고 인간 개입 없이 자율적으로 익스플로잇을 작성하는 데 성공했다. 주요 성과를 보면 오픈BSD에 27년 전부터 잠재해 있던 취약점을 발견했다. 공격자는 임의 머신에 접속하는 것만으로 충돌을 일으킬 수 있다. 또 FFmpeg에 16년 전부터 잠재해 있던 취약점을 발견했다. 이 취약점은 자동 테스트 도구에 의한 500만 회 이상 스캔에서도 발견되지 않았다. 이어 리눅스 커널에 존재하는 복수 취약점을 발견하고 이를 조합해 완전한 접근 권한을 획득하는 익스플로잇을 작성했다.

앤트로픽은 AI 개발 속도를 감안하면 악용 리스크가 높은 AI가 널리 공개되는 건 시간문제라고 지적하며 공격자에 의한 악용이 시작되기 전에 AI를 방어 목적으로 사용하는 긴급 대응책으로 프로젝트 글래스윙을 시작했다.

프로젝트 글래스윙은 복수 조직에 클로드 미토스 프리뷰 등 AI 모델 접근 권한을 부여해 취약점 발견에 활용하는 취지를 담은 이니셔티브다. 참여 조직에는 AWS, 앤트로픽, 애플, 브로드컴, 시스코, 크라우드스트라이크, 구글, JP모건 체이스, 리눅스재단, 마이크로소프트, 엔비디아, 팔로알토 네트웍스가 포함되며 향후 40개 이상 조직으로 확대될 예정이다.

프로젝트 글래스윙 참여 조직에는 최대 1억 달러 상당 AI 이용 크레딧이 제공된다. 참여 조직 대상 클로드 미토스 프리뷰 요금은 100만 토큰당 입력 25달러, 출력 125달러다. 또 알파-오메가(Alpha-Omega)와 오픈SSF(OpenSSF)에 250만 달러, 아파치 소프트웨어 파운데이션(Apache Software Foundation)에 150만 달러를 지원하겠다는 내용도 발표됐다.

앤트로픽은 클로드 미토스 프리뷰의 사이버 공격 및 방어 기능에 관해 정부 기관과도 협의를 진행하고 있다고 밝혔다. 클로드 미토스 프리뷰 일반 공개는 계획되어 있지 않으며 위험한 출력을 방지하기 위한 세이프가드 구축이 진행 중이다. 관련 내용은 이곳에서 확인할 수 있다.