AI 기업 앤트로픽(Anthropic)이 AI 모델의 성능과 사회적 영향을 평가할 수 있는 새로운 유형의 벤치마크 개발을 위한 자금 지원 프로그램을 시작했다.
이번 프로그램은 AI 기술의 급속한 발전에 따른 평가 도구의 부족 문제를 해결하기 위한 노력의 일환이다. 회사 블로그에 따르면 이 프로그램은 AI 모델의 고급 기능을 효과적으로 측정할 수 있는 서드파티에 자금을 지원할 예정이다.
프로그램은 AI 보안 및 사회적 영향에 중점을 둔 벤치마크 생성을 목표로 한다. 이에 사이버 공격 수행 능력, 대량 살상 무기 강화 능력, 딥페이크 등 인간 조작 능력 등 AI의 잠재적 위험을 평가하는 테스트를 특별히 요구한다. 이는 AI 기술의 발전이 가져올 수 있는 부정적 영향에 대한 회사의 인식을 반영한 것으로 보인다.
일각에서는 새로운 벤치마크를 수립하려는 AI 회사가 해당 테스트를 자사 AI 모델이 다른 모델보다 우수하다는 증거로 사용할 수 있기 때문에 불신하기도 하지만 포괄적 AI 평가를 만든다는 점에서 AI 산업 전반에 대한 발전을 촉진한다고도 여겨진다.
