본문 바로가기
IT

구글 제미나이 2.0, AI 역사상 최초로 네이티브 이미지 생성 기능 탑재

by 뉴스숲지기 2025. 3. 21.

목차

    구글 제미나이 2.0, AI 역사상 최초로 네이티브 이미지 생성 기능 탑재

    구글이 멀티모달 AI 모델 '제미나이'에 혁신적인 기능을 추가했습니다. 이제 '이매진 3(Imagen 3)'와 같은 외부 이미지 생성 도구 없이도, 제미나이 자체에 내장된 이미지 생성 기능을 사용할 수 있게 되었습니다. 이는 별도의 이미지 생성 모델 연결 없이 대형 멀티모달 모델(LMM) 내에 이미지 생성 기능을 네이티브로 탑재한 최초의 사례입니다.

    제미나이 2.0 플래시, 혁신적인 네이티브 이미지 생성 기능 공개

    구글 딥마인드는 지난 13일(현지시간) '제미나이 2.0 플래시'에 네이티브 이미지 생성 기능을 추가한 실험 버전인 '제미나이-2.0-플래시-exp(gemini-2.0-flash-exp)'를 공식 발표했습니다. 제미나이 2.0 플래시는 작년 12월에 처음 공개된 모델로, 텍스트, 코드, 이미지, 오디오, 비디오 등 다양한 형식의 콘텐츠를 이해하고 처리할 수 있는 멀티모달 AI 모델입니다.

     

    이번에 추가된 네이티브 이미지 생성 기능을 통해 사용자들은 별도의 이미지 생성 도구 없이도 제미나이 2.0 플래시에서 직접 이미지를 생성할 수 있게 되었습니다. 이는 기존의 방식과 완전히 다른 접근법입니다.

    기존 AI와 차별화되는 혁신적 아키텍처

    기존 AI 시스템들은 트랜스포머 구조를 가진 대형언어모델(LLM)에 '확산 모델(Diffusion)'인 이미지 생성기를 별도로 통합하는 방식을 사용했습니다. 하지만 제미나이 2.0 플래시는 하나의 LLM 안에 언어 생성과 이미지 생성 기능을 모두 통합한 최초의 사례로 평가받고 있습니다.

     

    이러한 혁신적인 아키텍처 덕분에 제미나이 2.0 플래시는 다른 AI 모델들과 비교해 여러 가지 장점을 제공합니다.

    주요 장점 및 활용 사례

    첫째, 제미나이 2.0 플래시의 뛰어난 언어 능력을 기반으로 등장인물과 설정의 일관성을 완벽하게 유지하면서 삽화가 포함된 이야기를 생성할 수 있습니다. 이는 창작자들에게 특히 유용한 기능이 될 것입니다.

    둘째, 제미나이 2.0 플래시의 광범위한 지식과 향상된 추론 능력을 활용하여 맥락에 완벽하게 부합하는 이미지를 생성할 수 있습니다. 예를 들어, 실제 재료와 요리 방법에 맞는 상세한 비주얼로 레시피를 생성하는 것이 가능해졌습니다.

    셋째, 사용자와 챗봇이 번갈아가며 대화하는 '멀티턴 대화' 기능을 통해 이미지를 자연스럽고 점진적으로 수정할 수 있습니다. 이 기능은 디자인 작업이나 창작 과정에서 특히 유용하게 활용될 것으로 예상됩니다.

    개발자 접근성 및 활용 방안

    구글은 이 혁신적인 모델을 '구글 AI 스튜디오'를 통해 개발자들에게 공개했습니다. 또한 제미나이 API를 사용하면 개발자들이 자신의 애플리케이션에 이미지 생성 기능을 손쉽게 통합할 수 있습니다.

     

    구글은 공식 발표에서 "제미나이 2.0 플래시는 멀티모달 입력과 향상된 추론, 자연어 이해를 결합해 이미지를 생성한다"라며 "이를 AI 에이전트 구축에 활용할 수 있고, 그림으로 표현된 대화형 스토리 앱을 개발할 수 있으며, 채팅 내용에서 이미지를 생성하는 등 다양한 용도로 활용할 수 있다"라고 밝혔습니다.

    업계와 사용자들의 반응

    제미나이 2.0 플래시의 네이티브 이미지 생성 기능에 대한 초기 반응은 매우 긍정적입니다. 특히 이미지를 다양한 각도와 효과로 변형하는 과정에서 뛰어난 일관성을 유지한다는 평가가 많습니다. 한 사용자는 이 기능을 경험한 후 "이건 넥스트 레벨"이라는 짧지만 강렬한 소감을 남겼습니다.

     

    이번 발표는 AI 기술의 진화에 있어 중요한 전환점이 될 것으로 보입니다. 별도의 이미지 생성 모델 없이 하나의 AI 모델 안에서 텍스트와 이미지를 모두 생성할 수 있는 기능은 향후 AI 애플리케이션의 개발과 활용 방식에 큰 변화를 가져올 것으로 예상됩니다.

    구글의 이번 혁신은 AI 기술의 통합과 효율성 향상이라는 측면에서 중요한 발전으로, 앞으로 더 많은 기업들이 유사한 방향으로 기술을 발전시킬 것으로 전망됩니다.