목차
구글의 대반격: 제미나이 2.0과 AI 혁명의 최전선
지난 5일부터 12일 동안 오픈AI가 추론모델과 동영상 생성 서비스 ‘소라’를 출시하는 사이에 구글이 대반격을 개시했습니다. 구글은 오픈AI 발표 직전 혹은 직후에 정면으로 대응하는 경쟁작을 선보이며 전례 없이 공격적인 행보를 보였습니다.
구글의 AI 전략: 제미나이 2.0
11일, 구글은 제미나이 2.0을 발표했습니다. 제미나이는 멀티모달 AI 에이전트를 전면에 내세우며 고도화된 기능을 통해 AI 시장의 혁신을 주도하고 있습니다. 순다 피차이 구글 CEO는 “제미나이 2.0은 차세대 모델로, 검색과 같은 제품을 AI로 완전히 변형할 수 있는 잠재력을 가졌다”고 밝혔습니다.
제미나이 2.0 플래시
제미나이 2.0 플래시는 멀티모달 기능을 강화하여 텍스트, 이미지, 오디오를 이해하고 생성할 수 있습니다. 구글 딥마인드는 플래시가 이전 버전보다 2배 빠른 속도를 제공한다고 발표했습니다. 구글 AI 스튜디오와 같은 플랫폼에서 실험적 모델로 이용할 수 있으며, 조기접근 파트너를 통해 텍스트-음성 변환 및 기본 이미지 생성 기능을 사용할 수 있습니다.
새로운 프로젝트들: 아스트라와 마리너
프로젝트 아스트라
구글I/O에서 공개된 ‘아스트라’는 제미나이 2.0을 활용한 대화형 AI로, 멀티모달 작업을 통합하며 사용자와의 자연스러운 상호작용을 제공합니다. 최대 10분 길이의 대화 세션을 기억하며, 지연 시간을 대폭 개선했습니다.
프로젝트 마리너
‘마리너’는 웹 브라우저 내 정보를 추론하고 작업을 수행하는 AI 기반 크롬 확장 프로그램으로, 작업 정확성과 속도에서 새로운 기준을 제시했습니다. 하지만 구글은 안전 강화를 위해 인간 검토 과정을 포함할 것이라고 강조했습니다.
비디오와 이미지 생성의 혁신: 베오2와 이마젠3
베오2
베오2는 자연어 프롬프트로 4K 비디오를 생성할 수 있는 도구로, 실제 세계의 물리적 요소와 인간 표현의 디테일을 개선했습니다. 이 도구는 AI 생성물을 표시하는 ‘신스ID’ 워터마크를 포함하여 신뢰성을 강화했습니다.
이마젠3
이미지 생성 모델의 최신 버전인 이마젠3는 밝고 세밀한 이미지를 제공하며, 다양한 예술 스타일을 구현할 수 있습니다. 구글랩스의 이미지FX에서 이용 가능합니다.
제미나이 2.0 플래시 싱킹: 런타임 추론의 미래
구글은 제미나이 2.0 플래시 싱킹으로 추론의 정교함을 한 단계 끌어올렸습니다. 복잡한 문제를 단계적으로 해결할 수 있는 이 기능은 프로그래밍, 물리학 등 전문 분야에서 뛰어난 성능을 보입니다.
구글의 이러한 혁신적 행보는 AI 시장에서 오픈AI와의 경쟁을 더욱 치열하게 만들고 있습니다. 내년에도 AI 업계의 발전은 계속될 것으로 보이며, 제미나이 2.0과 같은 기술이 그 중심에 있을 것입니다.
'IT' 카테고리의 다른 글
네이버와 카카오의 API 생태계 경쟁: 플랫폼 주도권 쟁탈전 (4) | 2024.12.27 |
---|---|
한국어로 더 똑똑해진 구글 제미나이 라이브, 지금 만나보세요! (5) | 2024.12.20 |
AI가 경고하는 기후 변화: 2050년의 충격적인 전망 (4) | 2024.12.19 |
오픈AI, 광고 모델 도입 검토 중: AI와 비즈니스의 새로운 패러다임 (5) | 2024.12.18 |
일리야 수츠케버, '스케일링 법칙'의 종말 선언…AI의 미래는 '추론'에 달렸다 (5) | 2024.12.17 |