
이미 700억 파라미터 Llama 모델을 로컬에서 실행 가능하게 하고 있는 AMD AI 칩인 AMD Ryzen AI Max+ 395에 드라이버 업데이트가 적용되어 최대 1280억 파라미터 AI 모델을 처리할 수 있게 됐다. 이로 인해 최대 1090억 파라미터인 Llama 4 Scout를 로컬에서 실행할 수 있게 됐다.
7월 29일 AMD는 업데이트(AMD Variable Graphics Memory)를 실시해 윈도상 Vulkan llama.cpp에서 최대 1280억 파라미터를 지원 가능하게 했다. 이 업데이트는 조만간 릴리스될 드라이버(Adrenalin Edition 25.8.1 WHQL)에 포함된다. 업데이트에 따라 메모리 집약적인 AI 워크로드를 가능하게 하고 윈도 상 Ryzen AI MAX+ 395(128GB)에서 96GB VGM을 최대한 활용할 수 있게 된다.
이번 업데이트로 AMD Ryzen AI Max+ 395(128GB)는 메타 Llama 4 Scout 109B를 풀 비전과 MCP 지원으로 실행할 수 있는 세계 첫 윈도 AI PC 프로세서가 된다.
메타 Llama 4 Scout는 각 태스크에 최적화된 16개의 전문가 모델을 포함한 MoE 모델이다. 총 파라미터 수는 1090억이지만 한 번에 활성화되는 파라미터는 170억 뿐이다. 다만 모든 1090억 파라미터를 메모리에 보유해야 하기 때문에 메모리 사용량은 1090억 파라미터 모델과 동일하다는 설명이다.
사용자는 최대 초당 15토큰이라는 성능을 누릴 수 있다. AMD Ryzen AI Max+ 395는 노트북에도 탑재할 수 있기 때문에 외출 중에도 간편하게 고성능 모델을 시험해볼 수 있다.
또 컨텍스트 길이 25만 6000으로 Llama 4 Scout를 실행할 수 있는 것도 특징이다. 이를 통해 대량 토큰을 컨텍스트 내에 보유하는 게 가능해져 강력한 에이전트형 워크플로를 실현할 수 있다.
다른 데모에서는 AMD 분기별 실적 보고서를 가져와 요약하는 모습이 나타나 있다. AI가 여러 처리를 하는 중에 컨텍스트 내에는 1만 9642토큰을 보유해야 한다. 기본 컨텍스트 윈도우에서는 4096으로 컨텍스트 길이가 제한되어 있어 처리에 실패할 가능성이 있었지만 이번 업데이트를 통해 문제없이 처리를 완료할 수 있게 됐다.
새로운 업데이트는 프리뷰 드라이버와 LM 스튜디오를 다운로드해 시험해볼 수 있다. AMD는 AMD Ryzen AI Max+ 395는 얇고 가벼운 시스템에서 업계를 선도하는 윈도 플랫폼으로서의 우위를 더 강화한다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.
![[AI서머리] 아이디어만 있다면… 아폭 해커톤 개최‧한살림, 재생에너지 전환 시동](https://startuprecipe.co.kr/wp-content/uploads/2025/08/250801_hansalim.or_.kr_00001-75x75.jpg)

