Google, 차세대 AI 모델 “Gemini 2.0” 발표
Google이 차세대 AI 모델인 “Gemini 2.0″을 발표하며 모든 Gemini 사용자에게 응답 속도를 중시한 “Gemini 2.0 Flash”의 실험 버전을 공개했다. Gemini 2.0은 텍스트, 이미지, 음성을 동시에 처리할 수 있는 멀티모달 AI로, 이전 모델보다 훨씬 높은 성능을 자랑한다. Gemini 2.0 Flash는 빠른 응답 속도를 유지하면서도 이전 세대의 상위 모델인 “Gemini 1.5 Pro”를 능가하는 성능을 보여준다. 또한, 새로운 이미지, 동영상, 음성 등의 멀티모달 입력과 출력도 지원한다. Google 검색, 코드 실행, 사용자 정의 함수 등 다양한 도구 호출 기능도 포함되어 있다. Google은 AI 에이전트 개발에도 힘쓰고 있으며, Project Astra는 현실 세계에서 멀티모달 이해를 활용하는 에이전트로, Gemini 2.0 모델을 사용하여 인간에 가까운 속도로 대화할 수 있다. DeepMind의 창업자 데미스 하사비스는 “Gemini 2.0 Flash는 시작에 불과하다”며, 2025년이 AI 에이전트의 해가 될 것이라고 언급했다.

시리와 챗GPT 통합…애플 인텔리전스와 챗GPT 연동했다
OpenAI는 “12 Days of OpenAI” 이벤트의 5일차인 2024년 12월 12일, ChatGPT와 Apple Intelligence의 통합을 발표했다. 이에 따라 iPhone, iPad, Mac 사용자는 Siri를 통해 ChatGPT를 사용할 수 있게 됐다. 이 통합은 iOS 18.2, iPadOS 18.2, macOS Sequoia 15.2 업데이트를 통해 이뤄졌으며, Siri 및 작성 도구에서 ChatGPT에 접근할 수 있다. 설정에서 ChatGPT를 활성화하면 Siri를 통해 직접 ChatGPT를 호출할 수 있다. Siri에게 “ChatGPT에게 크리스마스 파티를 기획해 달라고 해줘”라고 요청하면 ChatGPT가 날짜와 장소를 설정하고 참석자 목록을 작성해준다. 또 iPhone 16 시리즈의 카메라 제어 버튼을 사용해 사진에 대해 ChatGPT에 질문할 수도 있다. 이 통합으로 Siri가 ChatGPT가 적합한 작업이라고 판단하면 자동으로 ChatGPT가 응답하게 된다. 2025년 소프트웨어 업데이트를 통해 여러 언어 지원이 추가될 예정이다.

Midjourney, 이미지와 텍스트를 조합하는 거대한 캔버스 도구 ‘Patchwork’ 개발
이미지 생성 AI를 제공하는 Midjourney가 멀티플레이어 월드 구축 도구인 ‘Patchwork’를 공개했다. Patchwork는 언어 모델과 이미지 생성 모델을 결합하여 여러 사용자가 협력해 하나의 세계를 만들어낼 수 있는 도구다. Patchwork는 사용자가 스토리 아이디어를 구체적으로 발전시키고, 다른 사용자와 협력해 일관된 설정을 만들 수 있도록 도와준다. 또한, 이미지와 텍스트 조각을 결합해 시각적인 이야기를 구성할 수 있다. Patchwork는 텍스트에서 이미지를 생성하는 AI를 기반으로 하며, 사용자는 생성된 이미지 중에서 원하는 스타일을 선택해 자신만의 세계를 구축할 수 있다. 공유 보드에는 여러 사람이 접근 가능하며, 각자가 생성한 이미지를 공유하여 협력할 수 있다. Midjourney는 Patchwork에서 만든 캐릭터나 세계관을 다른 스토리텔링 애플리케이션에서도 사용할 수 있도록 계획 중이다. Patchwork는 연구 프리뷰 버전으로 공개되었으며, Midjourney 계정과 Google 로그인으로 이용할 수 있다. 현재 개발 단계인 만큼 일부 기능에서 불안정한 점이 있을 수 있다.
