x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

구글은 5월 19일부터 연례 개발자 회의인 구글 I/O(Google I/O) 2026을 개최하고 있다. 이런 구글이 기조연설에서 AI 시리즈인 제미나이 3.5(Gemini 3.5)를 발표했다. 구글은 제미나이 3.5를 최첨단 지능과 자율적인 행동성을 융합한 최신 모델 패밀리로 설명하며 첫 번째 모델로 제미나이 3.5 플래시(Gemini 3.5 Flash) 제공을 공식화했다.

제미나이 3.5 플래시는 제미나이 앱과 구글 검색 AI 모드를 통해 이용할 수 있다. 또 에이전트 개발 플랫폼인 구글 앤티그래비티(Google Antigravity), 구글 AI 스튜디오(Google AI Studio)와 안드로이드 스튜디오(Android Studio)의 제미나이 API, 제미나이 엔터프라이즈 에이전트 플랫폼(Gemini Enterprise Agent Platform)이나 제미나이 엔터프라이즈(Gemini Enterprise)를 통해서도 접근할 수 있다.

제미나이 3.5 플래시는 기존 플래시 시리즈 특유의 압도적인 속도를 유지하면서 여러 측면에서 플래그십 모델에 견줄 만한 고도의 지능을 제공한다. 구글은 AI 에이전트 구축과 코딩 분야에서 지금까지 가장 강력한 모델이라고 밝혔다.

실제로 난도 높은 코딩 및 에이전트 평가 벤치마크인 터미널-벤치(Terminal-Bench) 2.1, LLM 추론 능력을 측정하는 GDPval-AA, 멀티 에이전트 협조 능력을 평가하는 MCP 아틀라스(MCP Atlas)에서 제미나이 3.5 플래시는 제미나이 3.1 프로(Gemini 3.1 Pro)를 상회하는 점수를 기록했다. 또 학술 도표를 포함한 멀티모달 이해력을 측정하는 벤치마크 차X이브 리즈닝(CharXiv Reasoning)에서도 84.2%라는 우수한 성적을 거뒀다. 초당 출력 토큰 수는 다른 최첨단 모델 대비 4배 빠른 속도를 자랑한다.

제3자 기관인 아티피셜 애널리시스(Artificial Analysis) 인덱스에서 제미나이 3.5 플래시는 최상위 세그먼트인 리더 부문에 이름을 올렸다. 구글은 이를 두고 탁월한 처리 속도를 확보하기 위해 모델 품질이나 정확도를 희생할 필요가 없어졌다는 걸 증명하는 결과라고 강조했다.

제미나이 3.5 플래시는 구글 앤티그래비티 하네스(harness)와 결합하면 복수 서브 에이전트를 협조적으로 구동하는 강력한 엔진으로 진화한다. 이를 통해 극도로 높은 요구 수준인 대규모 유스케이스에도 대응할 수 있게 되며 인간 감독 하에 최첨단 성능을 유지하면서 여러 단계로 구성된 복잡한 워크플로와 코딩 작업을 높은 신뢰성으로 원활히 실행할 수 있다.

아울러 멀티모달 성능을 통해 더욱 표현력이 풍부하고 인터랙티브한 웹 UI 및 그래픽스 생성도 가능해진다.

구글은 구글 I/O 2026에서 개인용 AI 에이전트인 제미나이 스파크(Gemini Spark)를 발표했으며 제미나이 스파크에도 제미나이 3.5 플래시가 전면 채택됐다. 제미나이 스파크는 현재 신뢰할 수 있는 테스터를 대상으로 배포 중이며 6월까지 미국 구글 AI 울트라(Google AI Ultra) 사용자를 대상으로 베타 버전이 제공될 예정. 구글 AI 검색에도 제미나이 3.5 플래시가 적용됐다.

제미나이 3.5는 구글이 정한 최첨단 안전 기준인 프런티어 세이프티 프레임워크(Frontier Safety Framework)에 준거해 개발됐다. 사이버보안과 CBRN(화학·생물·방사성물질·핵) 관련 방어·안전 대책을 대폭 강화해 유해 콘텐츠 생성 위험을 극한까지 낮췄다. 동시에 안전한 질문에 대해 오류로 답변을 거부하는 확률도 크게 줄이는 데 성공했다. 구글은 AI가 답변을 출력하기 전에 내부 추론 과정을 검증·이해하기 위한 인터프리터빌리티 툴(Interpretability tools) 등 고도의 안전 트레이닝과 완화 조치를 도입한 결과라고 설명했다.

한편 구글은 제미나이 3.5 프로(Gemini 3.5 Pro) 개발도 진행 중이라고 밝혔다. 이미 구글 사내에서는 제미나이 3.5 프로 활용이 시작된 것으로 알려졌으며 일반에는 6월 출시될 예정이다. 관련 내용은 이곳에서 확인할 수 있다.

한편 구글은 구글 검색에 고도화된 AI 모델 기능을 도입한다고 발표했다. 이에 따라 사용자는 단순히 질문하는 것만으로 에이전트를 활용할 수 있게 된다. 또 AI를 탑재한 새로운 인텔리전트 검색창도 등장했으며 검색창으로서는 지난 25년 이상 동안 최대 규모 업그레이드라고 구글은 밝혔다.

앞서 밝혔듯 구글 검색 AI 모드 기본 AI 모델이 제미나이 3.5 플래시로 업그레이드된다. 아울러 구글은 검색창에 지난 25년간 최대 규모 업데이트를 적용했다고도 발표했다. 새 검색창은 역대 가장 강력한 AI 도구를 손쉽게 사용할 수 있도록 하며 보다 직관적인 질문을 가능하게 한다.

새 검색창은 이전보다 더 직관적으로 조작할 수 있으며 알고 싶은 내용을 정확히 설명할 수 있도록 입력에 맞춰 화면이 동적으로 확장된다. 사용자 의도를 미리 파악하도록 설계되어 기존 자동완성 기능을 넘어선 AI 기반 제안이 가능하며 질문을 구성하는 데 도움을 준다. 텍스트뿐 아니라 이미지·파일·동영상, 그리고 열려 있는 구글 크롬 탭까지 모든 형식을 조합해 검색할 수 있다. 기존과 마찬가지로 폭넓은 검색 결과도 제공된다. 새로운 인텔리전트 AI 검색창은 5월 20일부터 AI 모드를 이용할 수 있는 모든 국가와 언어에서 순차적으로 제공될 예정.

또 검색 결과에서 곧바로 대화를 이어가기가 더 쉬워졌다. 검색 결과 페이지 AI 개요에서 직접 추가 질문을 던지고 AI 모드에서의 자연스러운 대화를 이어갈 수 있다. 그간의 대화 맥락이 유지되며 조사를 심화해 나갈수록 표시되는 링크와 참고 기사 관련성도 높아진다. 이 원활한 검색 경험도 5월 20일부터 전 세계 데스크톱 및 모바일 환경에서 이용 가능하다.

그 밖에도 다양한 일상 작업에 맞춰 여러 AI 에이전트를 손쉽게 생성·맞춤 설정·관리할 수 있게 된다. 그 첫걸음으로 정보 수집에 특화된 자율형 AI 에이전트인 정보 에이전트 기능이 먼저 제공된다. 이 기능은 24시간 365일 백그라운드에서 가동하며 정보를 고도로 추론해 필요한 정보를 필요한 타이밍에 찾아주는 역할을 한다.

정보 에이전트 기능을 활용하면 가장 관심 있는 사안의 최신 정보를 항상 파악할 수 있다. 에이전트가 블로그, 뉴스 사이트, 소셜 미디어 게시물 등 웹상 모든 정보는 물론 금융·쇼핑·스포츠 등 실시간 최신 데이터까지 지능적으로 확인하며 특정 질문과 관련된 변화가 있는지 상시 체크해 준다.

에이전트는 정보를 스마트하게 요약해 업데이트를 알려주고 다음 행동으로 원활하게 이어준다. 예를 들어 이상적인 방을 찾고 있다면 원하는 세부 조건을 떠오르는 대로 에이전트에 제시해 두면 에이전트가 지속적으로 검색해 조건에 맞는 매물이 나왔을 때 알림을 보내준다. 정보 에이전트 기능은 2026년 여름 이후 구글 AI 프로 및 울트라 구독자에게 우선 순차 제공될 예정이다.

아울러 현재 미국에 한해 제공 중인 구글 검색 에이전트형 예약 기능이 지역 체험 이벤트·각종 서비스 등 폭넓은 신규 작업으로 확대된다. 금요일 밤에 6명이 이용할 수 있고 심야까지 음식 주문이 가능한 노래방 룸을 찾아달라는 것처럼 구체적인 지시를 내리기만 하면 최신 요금과 예약 가능 여부를 정리해 그 자리에서 예약까지 완료할 수 있는 링크를 제시해 준다. 주거 수리, 미용, 반려동물 케어 등 특정 분야에서는 사용자를 대신해 구글 검색이 업체에 직접 전화를 걸도록 요청하는 것도 가능하다. 이런 기능은 2026년 여름부터 미국 내 모든 사용자를 대상으로 순차 제공된다.

구글 안티그래비티(Google Antigravity) 기능과 제미나이 3.5 플래시의 에이전트형 코딩 기능이 구글 검색에 직접 통합된다. 이를 통해 검색 기능이 사용자 질문에 대해 최적의 형식으로 답변을 즉석에서 구성할 수 있게 된다. 시각적 도구와 시뮬레이션 등 개인 필요에 맞춘 맞춤형 생성 UI를 이용할 수 있게 된다.

예를 들어 우주물리학 개념을 깊이 이해하고 싶을 때나 기계식 손목시계가 작동하는 원리를 시각적으로 확인하고 싶을 때도 구글 검색이 실시간으로 인터랙티브한 이미지·표·그래프·시뮬레이션 같은 요소를 조합해 맞춤형 레이아웃을 구성해 준다. 이 맞춤형 생성 UI 기능은 2026년 여름 이후 구글 검색을 이용하는 모든 사용자를 대상으로 순차적으로 무료 제공될 예정이다.

결혼식 준비나 이사 준비 등 반복적인 검색이 필요한 장기 작업에 대해 구글 검색은 언제든 돌아와 작업을 재개할 수 있는 사용자 전용 맞춤 대시보드와 트래커를 구축할 수 있게 된다. 구글은 이를 자신의 특정 작업을 위해서만 만들어진 미니 앱과 같은 것이라고 설명했다. 안티그래비티를 활용해 검색 화면에서 직접 미니 앱 형태의 맞춤 경험을 구축할 수 있는 기능은 우선 미국 구글 AI 프로와 울트라 구독자를 대상으로 향후 수개월 내에 제공될 예정이다.

AI가 진정으로 유용한 존재가 되려면 전 세계 정보를 알고 있는 건 물론 개별 사용자 맥락을 이해해야 한다. 이에 구글은 유료 구독 없이도 전 세계 200개 국가 및 지역 사용자를 대상으로 98개 언어에서 AI 모드 퍼스널 인텔리전스 제공을 확대한다. G메일, 구글 포토, 구글 캘린더 등 앱과 안전하게 연동하는 것도 가능하다. 퍼스널 인텔리전스는 투명성, 선택의 자유, 사용자가 직접 제어할 수 있는 컨트롤을 최우선으로 설계됐다. G메일, 구글 포토 등의 앱을 연동할지 여부와 시기는 항상 사용자 스스로 관리할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

한편 구글 AI 연구개발 부문인 구글 딥마인드가 새로운 제미나이 모델 패밀리로 동영상을 비롯한 모든 입력으로부터 다양한 결과물을 생성할 수 있는 새로운 멀티모달 생성 모델인 제미나이 옴니(Gemini Omni)를 발표했다. 첫 번째 모델로 제미나이 옴니 플래시(Gemini Omni Flash)가 제미나이 앱·구글 플로(Google Flow)·유튜브 쇼츠에서 순차 제공된다.

제미나이 옴니는 자연어만으로 보다 직관적으로 동영상을 편집할 수 있는 모델. 모든 프롬프트가 이전 문맥을 이어받기 때문에 등장 캐릭터 외형과 특징은 일관되게 유지되며 물리 법칙도 무너지지 않고 장면 전체 흐름도 확실히 기억된다고 한다.

제미나이 옴니는 단순히 사실적으로 보이는 장면을 만들어내는 데 그치지 않고 다음에 무슨 일이 일어날지를 논리적으로 추론한다고 한다. 물리 법칙에 대한 직관적인 이해와 제미나이가 보유한 역사·과학·문화적 배경 지식을 결합해 단순한 사진과 같은 아름다움을 넘어선 의미 있는 스토리텔링이 가능해진다.

짧은 프롬프트만으로도 제미나이 옴니가 난해하고 복잡한 아이디어를 알기 쉽게 풀어낸 비주얼을 생성해 준다. 또 입력 레퍼런스 기능을 활용하면 좋아하는 캐릭터 이미지, 배경 장면, 혹은 손으로 그린 스케치 등을 바탕으로 머릿속에 그린 비전과 완전히 일치하는 작품을 만들어낼 수 있다고 한다.

아울러 구글은 사용자 본인 목소리로 동영상을 제작할 수 있는 아바타 기능을 제공한다고 발표했다. 이를 통해 사용자는 자신의 디지털 버전을 생성하고 외모와 목소리 모두 자신을 닮은 동영상을 만들 수 있게 된다. 이 기능은 이미 유사한 형태로 유튜브 쇼츠 일부 사용자를 대상으로 시험적으로 도입됐다는 사실이 보도된 바 있다.

제미나이 옴니로 생성된 모든 동영상에는 전자 워터마크 기술인 신스아이디(SynthID)가 삽입된다고 한다. 해당 동영상이 제미나이 옴니에 의해 생성된 것인지 여부는 제미나이 앱, 제미나이인크롬(Gemini in Chrome) 혹은 구글 검색을 통해 손쉽게 확인할 수 있다.

제미나이 옴니 플래시는 5월 20일부터 전 세계 모든 구글 AI 플러스·프로·울트라 사용자를 대상으로 제미나이 앱 및 구글 플로를 통해 순차적으로 제공이 시작된다. 또 유튜브 쇼츠 및 유튜브 크리에이트(YouTube Create) 앱 사용자에게도 무료로 순차 제공된다. 아울러 6월까지 API를 통해 개발자 및 기업을 대상으로도 제공이 시작될 예정이다. 관련 내용은 이곳에서 확인할 수 있다.

구글은 또 과학적 탐구 규모와 정확도를 크게 확장하기 위해 설계된 제미나이 포 사이언스(Gemini for Science)를 발표했다.

현재 과학계는 인류 전체 지식이 빠르게 팽창하면서 개별 과학자가 전체상을 파악하기가 점점 더 어려워지고 있다는 역설에 직면해 있다. 과학적 돌파구 상당수는 데이터 간 창의적인 연결고리를 발견하는 데서 비롯되지만 이를 수작업으로 수행하려면 수 주에서 수 개월이 걸리기도 한다. 구글은 방대한 데이터를 검토하는 것만으로 시간을 다 써버리는 상황을 없애기 위해 AI를 활용할 수 있다고 설명한다. AI는 과학 연구 병목을 해소하고 복잡한 과제를 처리해 과학 연구 역량을 몇 배로 끌어올리는 원동력이 된다는 것.

구글은 제미나이 포 사이언스의 실험적 도구로 구글 랩스(Google Labs)에서 3가지 주요 프로토타입을 공개한다. 첫째 가설 생성 기능(Hypothesis generation). 코-사이언티스트(Co-Scientist)를 기반으로 구축된 기능이다. 새로운 아이디어 창출은 과학 핵심이지만 매년 발표되는 논문 수백만 편을 모두 읽고 통합하는 건 인간의 힘만으로는 불가능하다. 가설 생성 기능은 과학적 방법론을 시뮬레이션해 이 간극을 메운다. 연구자와 협력해 연구 과제를 정의한 뒤 복수 AI 에이전트가 참여하는 아이디어 토너먼트를 열어 가설 생성·논의·평가를 자동 수행한다. 절대적인 엄밀성을 확보하기 위해 생성된 주장은 철저히 검증되며 클릭해서 확인할 수 있는 인용 출처가 반드시 명기된다.

둘째 계산 과학적 발견 기능(Computational discovery). 알파이볼브(AlphaEvolve)와 실증적 연구 지원 도구인 ERA(Empirical Research Assistance)를 기반으로 구축된 기능이다. 과학 진보는 컴퓨터를 활용한 계산 실험으로 실제 검증할 수 있는 가설의 수에 의해 제한되는 경우가 적지 않다. 자율적으로 작동하는 연구 엔진인 계산 과학적 발견 기능은 수천 가지 코드 변형을 병렬로 생성·평가함으로써 이 문제를 해결한다. 이를 통해 태양광 발전 예측이나 역학처럼 극도로 복잡한 분야에서 수작업으로는 수개월이 걸릴 새로운 모델링 기법 검증을 원활하게 수행할 수 있게 된다.

셋째 문헌 인사이트 기능(Literature insights). 구글 노트북LM을 기반으로 구축된 기능이다. 과학 문헌을 깊이 이해하는 건 모든 연구 활동에서 빼놓을 수 없는 과정이다. 문헌 인사이트 기능은 방대한 과학 문헌을 검색해 커스터마이즈 가능한 검색 속성을 갖춘 표에 비교 형식으로 정리한다. 연구자는 채팅 기능을 통해 직접 엄선한 문헌 데이터를 바탕으로 세밀한 뉘앙스를 파고들 수 있으며 보고서·슬라이드 자료·인포그래픽·음성 및 동영상 개요 해설 같은 고품질 산출물도 손쉽게 생성할 수 있다. 노트북LM을 활용해 문헌 인사이트 기능은 복수 논문에 걸친 지견 통합, 미개척 연구 분야 발굴, 새로운 기회 발견을 지원한다.

나아가 구글은 제미나이 포 사이언스 일환으로 새롭게 사이언스 스킬(Science Skills)을 제공한다. 이는 유니프롯(UniProt), 알파폴드 데이터베이스(AlphaFold Database), 알파게놈 API(AlphaGenome API), 인터프로(InterPro) 등 생명과학 분야 30개 이상 주요 데이터베이스 및 도구에서 얻은 지식을 통합한 특화형 패키지다. 구글 안티그래비티(Google Antigravity) 같은 에이전트형 플랫폼에서 사이언스 스킬을 활용하면 연구자는 기존에 몇 시간씩 걸리던 구조 생물정보학이나 게놈 분석 같은 복잡하고 수작업이 많던 워크플로를 단 몇 분 만에 처리할 수 있게 된다.

사이언스 스킬을 활용하는 구글 연구팀은 이미 이 압도적인 속도 향상을 실증했다. 초기 테스트에서 구글 연구팀은 사이언스 스킬을 사용해 보통 몇 시간이 걸리는 복잡한 분석을 불과 몇 분 만에 완료했다. 그 결과 AK2 유전자 변이로 인해 발생하는 희귀 유전 질환의 잠재적 발병 메커니즘에 관한 기존에 없던 새로운 지견을 얻는 데 성공했다.

구글은 전문가 수준 과학 코딩을 지원하는 AI 도구 ERA도 발표했다. ERA는 과학적 문제와 성공 기준이 주어지면 과학 문헌 검색, 코드 작성, 해결책 검토, 복수 기법 조합, 그리고 결과 평가를 수행할 수 있다. ERA는 수천 가지 선택지를 고려해 트리 탐색 방식을 활용, 주어진 목표에 대해 출력 코드를 최적화한다. ERA는 게노믹스, 공중 보건, 위성 영상 분석, 신경과학 예측, 일반적인 시계열 예측 벤치마크, 수학 등 다양한 분야 벤치마크 문제에서 모두 전문가 수준 성능을 달성했다. 구글은 ERA에 대해 향후 전문가 수준의 계산 모델링에 대한 접근을 민주화하고 기존 전문가 역량을 확장할 가능성을 지니고 있다고 평가했다.

ERA는 과학 저널 네이처(Nature)에도 게재됐다. ERA 프로토타입은 현재 구글 랩스 테스터 프로그램을 통해 이용할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

한편 구글은 지난 1월 사용자가 독자적인 인터랙티브 세계를 만들 수 있는 웹앱인 프로젝트 지니(Project Genie)를 발표한 바 있다. 이번 행사 기간에는 구글 스트리트뷰를 활용해 프로젝트 지니에 실제 장소를 융합시키는 새로운 기능이 공개됐다.

프로젝트 지니는 세계 모델 지니 3(Genie 3)에 이미지 생성 AI인 나노 바나나 프로와 제미나이 3을 결합한 웹앱으로 사용자가 세계 모델의 몰입형 체험을 직접 경험할 수 있도록 설계됐다. 텍스트 입력 프롬프트나 업로드된 이미지를 바탕으로 가상 세계가 생성되며 사용자가 이동하는 방향에 맞춰 길 앞쪽이 실시간으로 생성된다.

이런 프로젝트 지니에 구글 스트리트뷰를 활용한 위치 정보 기능이 추가됐다. 지도 핀을 탭해 미국 내 장소를 선택한 뒤 사막, 석기 시대 같은 스타일이나 동물, 몬스터 같은 캐릭터를 지정하면 스트리트뷰 실제 이미지를 기반으로 한 가상 세계를 생성할 수 있다.

실제 생성 과정을 보여주는 데모도 공개됐다. Choose a location from Google Maps를 클릭한 뒤 지명 등으로 검색해 구글 맵 스트리트뷰에서 이미지를 선택하고 Use this location을 클릭한다. 이후 생성할 세계 특성을 선택하는데, 데모에서는 Underwater Drive가 선택됐다. 마지막으로 Create world를 클릭해 세계를 생성한다. 그 결과 고속도로 풍경이 그대로 바다에 잠긴 듯한 세계가 생성됐다.

프로젝트 지니 스트리트뷰 기능은 미국 내 일부 지역에서 이용 가능하며 향후 대상 지역을 확대해 나갈 예정이다.

프로젝트 지니는 실험적인 프로토타입으로 접근은 미국 거주 18세 이상 구글 AI 울트라 사용자에 한정되어 있었다. 5월 19일부터 전 세계 구글 AI 울트라 사용자에게 순차적으로 제공된다고 공지됐다. 관련 내용은 이곳에서 확인할 수 있다.

또 유튜브는 맞춰 대화형 검색인 애스크 유튜브(Ask YouTube), 유튜브 쇼츠 리믹스 기능 및 유튜브 크리에이트 앱에 멀티모달 생성 AI 제미나이 옴니 적용을 발표했다.

애스크 유튜브는 사용자가 더 복잡한 검색 내용을 자연스러운 말로 질문할 수 있는 새로운 검색 경험이다. 예를 들어 아이에게 자전거 타는 법을 가르치는 방법이나 잠자리에 들기 전 즐길 수 있는 게임 크리에이터 리뷰 등을 찾을 수 있다.

애스크 유튜브에서는 추가 질문을 이어가며 검색 내용을 더 좁혀나갈 수 있다. 유튜브 전체 카탈로그에서 장편 동영상과 쇼츠를 포함한 연관성 높은 영상을 모아 대화형·구조화된 답변으로 제시한다. 애스크 유튜브는 현재 기준으로 미국 내 18세 이상 유튜브 프리미엄 회원을 대상으로 제공되고 있다. 유튜브는 향후 모든 사용자에게 폭넓게 확대 제공할 예정이라고 밝혔다.

또 유튜브 쇼츠 리믹스 기능과 유튜브 크리에이트 앱에 제미나이 옴니가 도입된다. 대상 쇼츠 동영상에 자신의 프롬프트나 이미지를 추가해 원본 영상 맥락을 유지하면서 새로운 영상 표현을 만들 수 있다.

아울러 사용자는 제미나이 옴니를 통해 좋아하는 크리에이터 옆에 자신을 등장시키거나 장면을 해적 풍으로 바꾸는 등 표현도 가능하다. 제미나이 옴니는 자연어로 입력된 텍스트 프롬프트로부터 사용자 의도를 보다 잘 파악하고 일관성 있는 스토리 구성을 지원하면서 복잡한 영상·음성 조정을 백그라운드에서 처리한다.

제미나이 옴니로 리믹스된 유튜브 쇼츠에는 디지털 워터마크인 신스ID와 식별용 메타데이터, 원본 영상 링크가 부여된다. 크리에이터는 자신의 콘텐츠를 관리할 수 있으며 쇼츠 동영상 리믹스 기능을 언제든지 옵트아웃할 수 있다.

크리에이터가 자신의 초상을 감지하고 관리할 수 있는 라이크니스 디텍션(Likeness detection)은 18세 이상 모든 크리에이터로 확대된다. 제미나이 옴니 기반 리믹스 기능은 유튜브 쇼츠 리믹스와 유튜브 크리에이트 앱에서 무료로 제공되기 시작하며 향후 AI 플레이그라운드(AI Playground)에도 도입될 예정이다. 관련 내용은 이곳에서 확인할 수 있다.

한편 구글 AI 워터마크 기술인 신스ID는 오픈AI가 채택해 자사 툴로 생성한 콘텐츠에 워터마크를 삽입하게 됐다.

신스ID는 인간이 인지할 수 없는 신호를 AI가 생성한 이미지·동영상·음성·텍스트에 삽입하는 기술. 이미지의 경우 크롭·회전·스크린샷 촬영 등의 처리를 거쳐도 신호가 손실되기 어렵고 텍스트는 일부 단어를 변경하거나 문장 표현을 다소 조정해도 신호가 유효하다고 알려져 있다.

이런 신스ID를 오픈AI가 채택한다. 오픈AI는 우선 챗GPT, 코덱스(Codex), 오픈AI API를 통해 생성되는 이미지에 신스ID를 적용할 예정이다. 콘텐츠 출처 정보를 메타데이터로 저장하는 콘텐츠 크리덴셜(Content Credentials)과 함께 활용해 콘텐츠 식별성을 높인다는 방침이다.

콘텐츠 크리덴셜은 오픈AI도 참여하는 표준화 단체 C2PA(Coalition for Content Provenance and Authenticity)가 책정한 체계로 작성자나 대체 텍스트, AI 사용 여부 등 정보를 메타데이터로 콘텐츠에 부여하는 것. 이 데이터는 콘텐츠 크리덴셜에 대응하는 앱에서 확인할 수 있으며 사용자는 해당 출처에 대해 자세히 알 수 있다.

구글도 콘텐츠 크리덴셜을 픽셀(Pixel) 단말에 채택해 촬영한 이미지에 메타데이터를 삽입하고 있다. 지금까지는 픽셀 10 이미지에만 구현됐지만 앞으로 동영상으로도 확장된 뒤 픽셀 8 및 픽셀 9에도 구현될 예정이다.

구글은 신스ID를 탐지하는 기능도 폭넓게 제공하고 있다. 최근에는 이미지·동영상·음성 대상 신스ID 검증 기능을 제미나이 앱에 추가했다. 새롭게 탐지 기능을 구글 검색에도 확장하고 향후 수 주 내에 크롬에도 도입할 예정이다. 구글 검색 내 렌즈(Lens), AI 모드, 서클 투 서치, 크롬 제미나이를 활용해 이미지 출처를 조회할 수 있게 된다.

한편 신스ID는 오픈AI 외에도 엔비디아, 카카오, 일레븐랩스 같은 기업에도 채택됐다. 관련 내용은 이곳에서 확인할 수 있다.

또 행사 기간 중 알파벳과 구글 CEO를 맡고 있는 순다르 피차이(Sundar Pichai)가 기조연설을 진행하며 구글이 처리하는 토큰 양이 급격한 속도로 증가해 최근인 5월 기준 월간 3,200조 토큰에 달했다고 밝혔다.

피차이는 학생이 기말시험을 위해 제미나이로 준비하거나 창작 과정 일환으로 아티스트가 리리아(Lyria)·베오(Veo) 같은 생성 AI를 활용하거나 개발자가 코딩을 통해 아이디어를 구현하는 등 AI가 다양한 방식으로 쓰이고 있다는 점을 놀라운 일이라고 표현하며 이런 사례가 발전을 가늠하는 최선의 지표라고 언급했다.

또 사람들이 AI를 얼마나 활용하고 있는지를 보여주는 또 다른 구체적인 지표로 토큰을 제시했다. 토큰은 AI 모델이 처리하는 데이터 기본 단위로 대부분 해결해야 할 과제를 나타낸다.

피차이에 따르면 2024년 5월 기준 구글이 처리하는 토큰 양은 9조 7,000억이었다. 이후 꾸준히 증가해 2025년 5월에는 480조에 도달했고 1년이 더 지난 올해 5월에는 3,200조에 이르렀다. 최근 1년간 성장률은 무려 7배에 달한다.

구글 AI를 활용하는 개발자는 월간 850만 명 이상이며 구글 AI 모델 API가 처리하는 토큰량은 분당 190억 토큰에 달한다. 지난 1년간 구글 클라우드 고객사 375곳 이상이 각각 1조 토큰 이상을 처리한 것으로 나타났다. 피차이는 모든 산업에서 AI에 대한 놀라운 수요가 있다는 것을 보여준다고 설명했다.

피차이 CEO는 구글이 에이전트형 제미나이 시대를 걷고 있다며 이 기술이 자사 미션을 가속화하고 전 세계 모든 사람에게 더욱 유용한 제품으로 발전해 나가는 새로운 길을 열어가는 모습을 기대한다고 말했다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post