
구글 로봇공학용 AI 모델인 제미나이 로보틱스에서 고도의 사고력을 갖춘 에이전트를 실현한 새 모델인 제미나이 로보틱스 1.5(Gemini Robotics 1.5)가 등장했다. 제미나이 로보틱스 1.5를 통해 환경을 적극적으로 이해하고 복잡한 다단계 작업을 일반적인 방법으로 완료할 수 있는 더 유능하고 다용도의 로봇을 구축할 수 있게 됐다.
제미나이 로보틱스는 제미나이 2.0을 기반으로 동작을 출력하는 기능을 추가해 로봇을 조작할 수 있게 한 AI 모델로 구두 지시를 통해 AI가 다양한 동작을 수행할 수 있다. 제미나이 2.0 모델이 지닌 세계 지식 덕분에 전혀 훈련에서 등장하지 않은 지시나 새로운 객체, 다양한 지시, 새로운 환경에 대한 대응을 잘한다.
지난 6월에는 인터넷 연결 없이 실행할 수 있는 제미나이 로보틱스 온디바이스(Gemini Robotics On-Device)가 출시됐다. 제미나이 로보틱스 온디바이스는 로컬에서 동작할 만한 소형 모델임에도 자연어 지시를 이해해 가방 지퍼를 여는 등 고정밀 동작이 가능하며 인터넷을 거치지 않아 저지연이 요구되는 작업에서 위력을 발휘한다.
9월 25일 구글은 새 모델인 제미나이 로보틱스 1.5를 발표했다. 제미나이 로보틱스 1.5는 구현화 추론 모델로 표현되며 물리 환경 내에서의 계획과 논리적 의사결정에 뛰어나다.
구글딥마인드가 공개한 제미나이 로보틱스 1.5 데모 동영상에서는 제미나이 로보틱스 1.5를 탑재한 로봇 암이 3종류 과일을 같은 색깔 접시에 나누어 담는 작업을 실행하고 있다.
다음으로 빨래를 색깔별로 분류하라는 작업을 줬을 때 제미나이 로보틱스 1.5는 흰색 옷은 흰색 바구니에, 색깔 있는 옷은 검은색 바구니에 넣어 빨래를 구분했으며 바구니 위치를 이동시키거나 바꿔도 작업을 완료했다. 시각으로 세계를 이해한 뒤 작업을 실행하려면 흰색 옷은 흰색 바구니에 넣는다고 작업 완료를 위한 동작을 사고해서 실행할 수 있다.
현재 있는 장소에 맞는 쓰레기 분리수거를 해달라고 지시했을 때는 위치를 확인한 뒤 분리수거 관련 정보를 취득하고 그에 맞춰 눈앞의 쓰레기를 여러 쓰레기통에 구분했다.
제미나이 로보틱스 1.5는 로봇이 복잡한 다단계 작업을 완료하도록 하는 에이전트 프레임워크로 동작한다.
또 동시에 발표된 제미나이 로보틱스-ER 1.5(Gemini Robotics-ER 1.5)는 동작 각 단계마다 제미나이 로보틱스 1.5에 자연어 지시를 주고 디지털 툴을 네이티브로 호출해 미션 완료를 위한 상세한 다단계 계획을 작성한다. 제미나이 로보틱스-ER 1.5가 물리 세계를 사고하는 모델로 기능해 작업 실행을 위한 각 단계의 지령을 보내고 제미나이 로보틱스 1.5가 실행해 동작하면서 사고하는 로봇을 실현하고 있다.
제미나이 로보틱스-ER 1.5는 신체성 추론을 위해 최적화된 첫 사고 모델로 학술 벤치마크와 사내 벤치마크 모두에서 최첨단 성능을 달성하고 있다. 로봇에는 다양한 모양과 크기가 있고, 다양한 감지 능력과 자유도를 갖고 있기 때문에 기존 제미나이 로보틱스(1.0)에서는 특정 로봇에서 학습한 동작을 다른 로봇에 유용하기 어려워 재학습이 필요한 경우가 많았다. 반면 제미나이 로보틱스 1.5는 서로 다른 형태를 횡단해 학습하는 고도의 능력을 갖추고 있어 로봇 형상에 맞춰 AI 모델을 특화시킬 필요가 없다.
또 제미나이 로보틱스 1.0은 시각 정보와 언어 입력에서 동작을 출력하는 직접적인 맵핑이 특징이었지만 제미나이 로보틱스 1.5에서는 동작 전에 자연어로 된 사고 토큰을 생성하는 구조가 추가되어 장기적인 작업이나 복잡한 작업 성공률을 향상시키고 있다. 구글은 제미나이 로보틱스 1.5를 행동하기 전에 생각하는 에이전트로 표현하고 있다.
구글 순다르 피차이 CEO는 제미나이 로보틱스 1.5에 대해 로봇이 더 잘 추론하고 사전에 계획하고 검색 등 디지털 툴을 사용하며 로봇 한 종류에서 다른 종류 로봇으로 학습 이전을 가능케 한다며 진정 유용한 범용 로봇으로의 다음 큰 걸음이라고 말했다.
제미나이 로보틱스 1.5 및 제미나이 로보틱스-ER 1.5를 이용하려면 테스터 프로그램 등록이 필요하다. 관련 내용은 이곳에서 확인할 수 있다.

한편 구글은 제미나이 25. 플래시(Gemini 2.5 Flash)와 제미나이 2.5 플래시-라이트(Gemini 2.5 Flash-Lite)에 업데이트를 적용했다고 발표했다. 두 모델 모두 응답 정확도와 속도가 향상됐으며 출력 비용도 낮아졌다.
제미나이 25. 플래시는 무료 버전 제미나이에서도 사용할 수 있는 경량이면서도 고성능인 AI 모델이고 제미나이 25. 플래시-라이트는 지연 시간 단축에 초점을 맞춰 개발된 고속 AI 모델이다.
제미나이 25. 플래시에서는 출력 토큰 수가 24% 감소했고 제미나이 25. 플래시-라이트에서는 50% 삭감에 성공했다. AI 모델에 대한 API 사용료는 토큰 수별로 과금되는 구조로 두 모델 모두 더 저렴하게 이용할 수 있게 됐다는 의미다.
https://platform.twitter.com/widgets.jsGemini 2.5 Flash just got a few new updates:
— Google Gemini App (@GeminiApp) September 25, 2025
You'll see enhanced step-by-step help for homework, better-organized responses, and improvements in image understanding. Here’s a breakdown of what’s new 🧵 pic.twitter.com/Pzv2mYNwKB
또 구글은 제미나이 25. 플래시 개선점으로 숙제 해결 방법을 명확하고 단계적으로 가르칠 수 있게 됐다, 복잡한 내용을 목록이나 표 등으로 정리해 출력할 수 있게 됐다는 점, 이미지 인식 정확도가 향상됐다는 점을 제시했다.
더 나아가 제미나이 시리즈 API에 최신 버전을 나타내는 -latest라는 별칭이 도입됐다. 이를 통해 개발자는 gemini-flash-latest와 같이 모델명 끝에 -latest를 붙이는 것만으로 각 모델 최신 버전을 지정할 수 있게 됐으며 제미나이 업데이트 때마다 소스 코드 내 제미나이 버전 번호를 다시 쓰는 작업을 할 필요가 없어졌다.
한편 제미나이 시리즈에 대해서는 다른 AI 모델과 비교해 답변 출력이 중단되는 빈도가 높다는 보고가 다수 접수되고 있다. 관련 내용은 이곳에서 확인할 수 있다.
![[AI서머리] 라피끄, 150억 시리즈 B 투자 유치‧에버온, 전기차 오토차징 서비스 출시](https://startuprecipe.co.kr/wp-content/uploads/2025/09/250929_sba.seoul_.kr_0520305-75x75.jpg)

