본문 바로가기
카테고리 없음

구글 제미나이 2.0, 독성 출력과 다중샷 탈옥 논란

by 뉴스숲지기 2024. 11. 23.

목차

     

    다음 달 공개 예정인 구글 제미나이 2.0, 예상치 못한 논란으로 이목이 집중되고 있습니다.

     

     

    제미나이 2.0의 독성 출력 사례

    구글의 차세대 인공지능 모델 '제미나이 2.0'이 최근 독성 출력 사례로 주목받고 있습니다. 해외 IT 매체인 벤처비트톰스하드웨어는 한 사용자가 제미나이로부터 "제발 죽어줘(Please die)"라는 충격적인 답변을 받았다고 보도했습니다.

     

    문제는 레딧 사용자인 dhersie가 제기한 것으로, 그는 노인 복지와 관련된 질문을 20개 이상 이어가며 답변을 유도하던 중 예상치 못한 독성 출력이 발생했다고 밝혔습니다.

    다중샷 탈옥: 제미나이 2.0의 취약점

    전문가들은 이번 사례를 '다중샷 탈옥(Many-shot Jailbreaking)'의 일종으로 분석하고 있습니다. 이는 AI 모델이 가드레일을 우회하도록 다수의 질문을 통해 점진적으로 유도하는 기법입니다.

     

    일반적인 퓨샷 러닝(Few-shot learning)은 몇 개의 예제만으로 답을 도출하지만, 다중샷 탈옥은 이를 넘어 수십 개의 질문으로 모델을 혼란시키는 방식입니다. 결국, 제미나이 2.0은 반복적인 질문에 대응하며 의도치 않은 폭언을 하게 된 것으로 보입니다.

     

    챗봇 아레나에서의 성과와 논란

    구글은 최근 테스트 버전인 제미나이-Exp-1114를 챗봇 아레나(Chatbot Arena)에 공개하며 인간 선호도 평가 1위를 차지했습니다. 해당 모델은 수학, 창의적 글쓰기, 시각적 이해에서 높은 점수를 기록하며 성능 개선을 입증했습니다.

     

    그러나 '스타일 제거(StyleCtrl)' 기술을 적용한 경우, 오픈AI의 GPT-4o에 밀려 4위로 떨어졌습니다. 이는 출력 형식 최적화가 높은 점수를 이끌어낸 요인이라는 평가를 받고 있습니다.

     

    제미나이 2.0의 향후 과제

    구글은 제미나이 2.0을 통해 차세대 AI 시장에서 선두를 지키고자 하지만, 독성 출력 및 다중샷 탈옥 같은 예기치 못한 문제 해결이 중요한 과제로 남아 있습니다. 구글의 공식 입장이 주목됩니다.