상세 컨텐츠

본문 제목

구글, 챗GPT를 무너뜨릴 AI 모델 제미나이(Gemini) 출시

IT 소식

by 웨어러블서치 2023. 12. 7. 15:30

본문

반응형

Google has been an ‘AI-first company’ for nearly a decade. Now, a year into the AI era brought on by ChatGPT, it’s finally making a big move.

구글은 거의 10년 동안 'AI 1등 기업'으로서의 역할을 해왔습니다. ChatGPT를 통해 AI 시대를 맞이한 지 1년이 지난 지금, 마침내 구글이 큰 움직임을 보이고 있습니다.


사진출처) 구글

 

구글(Google)의 선다 피차이(Sundar Pichai) CEO는 새로운 AI 시대, 즉 Gemini(제미나이, 쌍둥이자리) 시대의 시작이라고 선언했습니다. Gemini(제미나이)는 구글의 최신 대형 언어 모델로 피차이가 6월 I/O 개발자 컨퍼런스에서 처음 공개했으며 이제 일반에게 공개되었습니다. 피차이와 구글 딥마인드(Google DeepMind)의 CEO 데미스 하사비스(Demis Hassabis)의 설명으로는 궁극적으로 거의 모든 구글 제품에 영향을 미칠 AI 모델의 큰 도약이라고 합니다. 피차이는 "가장 강력한 점 중 하나는 기본 기술 연구로 더 좋게 만들 수 있었던 것이며, 이 기술이 즉시 우리 제품 전반에 사용될 수 있다는 것입니다."라고 말합니다.

제미나이(Gemini)는 단일 AI 모델 그 이상입니다. 안드로이드(Android) 기기에서 기본적으로 오프라인으로 실행되도록 설계된 제미나이 나노(Gemini Nano)라는 더 가벼운 버전이 있습니다. 곧 많은 구글 AI 서비스를 지원하고 오늘부터 바드(Bard)의 중추 역할을 할 제미나이 프로(Gemini Pro)라는 더 강력한 버전이 있습니다. 그리고 구글이 지금까지 만든 가장 강력한 LLM(Large language model)이며 대부분 데이터 센터 및 엔터프라이즈 애플리케이션용으로 설계된 것으로 보이는 제미나이 울트라(Gemini Ultra)라는 훨씬 더 유능한 모델이 있습니다.

구글은 현재 몇 가지 방법으로 제미나이를 사용할 수 있다고 합니다. 에서 바드(Bard)는 이제 제미나이 프로로 구동되며, Pixel 8 Pro 사용자는 제미나이 나노와 함께 몇 가지 새로운 기능을 얻게 됩니다. 제미나이 울트라는 내년에 출시될 예정입니다. 개발자와 기업 고객은 12월 13일부터 구글 생성형 AI 스튜디오(Google Generative AI Studio) 또는 구글 클라우드(Google Cloud)의 버텍스 AI(Vertex AI)를 통해 제미나이 프로에 접근할 수 있습니다. 제미나이는 현재 영어로만 제공되며 다른 언어도 곧 제공될 예정입니다. 그러나 피차이는 이 모델이 결국 전 세계의 구글 검색 엔진, 광고 제품, 크롬(Chrome) 브라우저 등에 통합될 것이라고 합니다. 이것이 구글의 미래이며, 빨리 다가온 것은 아닙니다.

 

사진출처) 구글

 

생성형 AI 경쟁업체인 오픈AI(OpenAI)는 1년 전에 챗지피티(ChatGPT)를 출시했고, 회사와 제품이 AI 분야에서 1위 기업이 되었습니다. 구글은 AI 기술에 대한 많은 기반 기술을 개발한 회사로, 지난 10년 동안 스스로를 'AI first' 조직이라고 선언 했으나, 챗지피티로 인해 선두를 빼앗겼고, 오픈AI가 업계를 빠르게 장악하는 것을 보고만 있었습니다. 구글은 마침내 반격할 준비가 되었습니다.

오픈AI의 최신 GPT-4 모델과 ​구글의 제미나이(Gemini)의 성능을 분석해 봐야 할 것 같습니다. 하사비스(Hassabis)는 “두 시스템을 나란히 놓고 벤치마킹을 매우 철저하게 분석했습니다.”라고 말했습니다. 구글은 다중 작업 언어 이해 벤치마크와 같은 광범위한 전체 테스트부터 두 모델의 파이썬(Python) 코드 생성 기능을 비교하는 테스트까지 두 모델을 비교하는 32개의 잘 확립된 벤치마크를 실행했습니다. 하사비스는 얼굴에 약간의 미소를 지으며 “32개 중 30개 벤치마크에서 우리가 상당히 앞서 있다고 생각합니다.”라고 말합니다. “뒤쳐지는 결과는 근소하지만, 앞서고 있는 일부 결과는 상당한 격차가 있습니다.”

구글은 제미나이가 32개 벤치마크 중 30개에서 GPT-4를 능가했다고 밝혔습니다.

 

사진출처) 구글
사진출처) 구글

 

이러한 벤치마크에서 제미나이의 장점은 비디오 및 오디오를 이해하고 상호 작용하는 능력에서 비롯됩니다. 이것은 매우 의도적으로 설계된 것입니다. 다중 양식은 처음부터 제미나이 계획의 일부였습니다. 구글은 오픈AI가 달리(DALL-E) 및 위스퍼(Whisper)를 만든 방식처럼 이미지와 음성에 대한 별도의 모델을 훈련하지 않았습니다. 처음부터 하나의 다감각 모델을 구축했습니다. 하사비스(Hassabis)는 “구글은 항상 매우 일반적인 시스템에 관심을 가져왔습니다. 그는 특히 이러한 모든 모드를 혼합하는 방법, 즉 다양한 입력 및 감각으로부터 최대한 많은 데이터를 수집한 다음 최대한 다양한 응답을 제공하는 방법에 관심이 있습니다."

https://youtu.be/jV1vkHv4zq8

 

현재 제미나이의 가장 기본적인 모델은 텍스트 입력 및 텍스트 출력이지만 제미나이 울트라(Gemini Ultra)와 같은 보다 강력한 모델은 이미지, 비디오 및 오디오와 함께 작동할 수 있습니다. 하사비스는 “그것보다 훨씬 더 일반화될 것입니다.”라고 말했습니다. "액션이나 터치 같은 것이 여전히 있습니다. 로봇 공학 유형에 더 가깝습니다." 시간이 지남에 따라 제미나이는 더 많은 감각을 얻고, 더 많은 인식을 갖게 되며, 그 과정에서 더 정확한 기반을 갖게 될 것이라고 말합니다. "이 모델은 주변 세계에 대해 더 잘 이해하고 있습니다." 물론 이러한 모델은 여전히 ​​환각 상태에 있으며 여전히 편견과 기타 문제를 안고 있습니다. 그러나 그들이 더 많이 알수록 더 나은 결과를 얻을 수 있다고 하사비스는 말합니다.

벤치마크는 단지 벤치마크일 뿐이며, 궁극적으로 제미나이의 기능에 대한 진정한 테스트는 이를 사용하여 아이디어를 브레인스토밍하고, 정보를 찾고, 코드를 작성하는 등의 작업을 수행하려는 일반 사용자로부터 나올 것입니다. 구글은 특히 코딩을 제미나이의 킬러 앱으로 보는 것 같습니다. 알파코드 2(AlphaCode 2)라는 새로운 코드 생성 시스템을 사용하여 코딩 능력을 비교하는 참가자의 85%보다 더 나은 성능을 발휘한다고 밝혔습니다. 이는 원래 알파코드(AlphaCode)의 50%에서 증가한 수치입니다. 그러나 피차이는 사용자가 모델이 다루는 거의 모든 부분에서 개선된 점을 느낄 것이라고 말합니다.

구글에게 마찬가지로 중요한 점은 제미나이가 분명히 훨씬 더 효율적인 모델이라는 것입니다. 구글의 자체 텐서(Tensor) 처리 장치에서 교육을 받았으며 PaLM과 같은 구글의 이전 모델보다 실행 속도가 빠르고 저렴합니다. 새 모델과 함께 구글은 대규모 모델을 훈련하고 실행하기 위해 데이터 센터에서 사용하도록 설계된 컴퓨팅 시스템인 TPU 시스템의 새 버전인 TPU v5p도 출시했습니다.

https://youtu.be/K4pX1VAxaAI

 

피차이와 하사비스의 대화를 보면 제미나이 출시를 더 큰 프로젝트의 시작이자 그 자체의 단계적 변화로 보는 것이 분명합니다. 제미나이는 구글이 기다려온 모델이며, 수년 동안 구축해 온 모델이며, 오픈AI와 챗GPT가 전 세계를 장악하기 전에 준비했어야 했던 모델일 수도 있습니다.

챗GPT 출시 이후 '코드 레드(Code Red, 비상사태)'를 선언하고 그 이후로 계속 따라잡기 위해 노력하고 있는 것으로 인식된 구글은 여전히 ​​'대담하고 책임감 있는' 모토를 고수하려고 노력하는 것 같습니다. 피차이와 하사비스는 경쟁업체를 따라잡기 위해 빨리 움직일 의향은 없다고 합니다. 궁극적인 AI 꿈에 가까워짐에 따라 인공 일반 지능(Artificial General Intelligence, 자기를 스스로 개선하고 인간보다 똑똑한 AI에 대한 용어)으로 세상을 바꿀 준비가 되어있습니다. 하사비스는 “AGI에 접근하면 상황이 달라질 것입니다. 일종의 능동적인 기술이기 때문에 조심스럽게 접근해야 한다고 생각합니다. 조심스럽지만 낙관적으로 생각합니다.”

 

https://youtu.be/LvGmVmHv69s

 

구글은 내부 및 외부 테스트와 레드팀을 통해 제미나이의 안전성과 책임감을 확보하기 위해 노력했다고 말합니다. 피차이는 데이터 보안과 신뢰성을 보장하는 것은 대부분의 생성형 AI가 수익을 창출하는 기업용 제품에서 특히 중요하다고 지적합니다. 하지만 하사비스는 최첨단 AI 시스템을 출시할 때 발생하는 위험 중 하나는 아무도 예측하지 못한 문제와 공격 경로가 있을 수 있다는 점을 인정합니다. 그는 "그렇기 때문에 공개해야 하는 것"이라며 "보고 배우기 위해서"라고 말합니다. 구글은 특히 제미나이 울트라의 출시를 늦추고 있는데, 하사비스는 이를 구글의 가장 유능하고 제약이 없는 모델을 위한 '안전한 실험 영역'을 갖춘 통제된 베타 버전이라고 합니다. 기본적으로 제미나이 내부에 스스로를 망치는 대체 인격이 있다면 구글은 사용자보다 먼저 그것을 찾으려고 합니다.

수년 동안 피차이를 비롯한 구글의 경영진은 AI의 잠재력에 대해 시적인 표현을 써왔습니다. 피차이 자신도 AI가 불이나 전기보다 인류를 더 혁신적으로 변화시킬 것이라고 여러 차례 말한 바 있습니다. 1세대인 제미나이 모델은 세상을 바꾸지 못할 수도 있습니다. 최상의 시나리오는 구글이 훌륭한 제너레이티브 AI를 구축하기 위한 경쟁에서 OpenAI를 따라잡는 데 도움이 될 수도 있습니다. 물론, 구글 최악의 시나리오는 Bard가 지루하고 평범하게 머물고 챗GPT가 계속 시장을 장악하는 것입니다. 하지만 피차이, 하사비스, 그리고 구글의 다른 모든 사람들은 이것이 정말 거대한 무언가의 시작이라고 생각하는 것 같습니다. 웹이 구글을 기술 대기업으로 만들었듯이 제미나이는 더 큰 기업이 되는 무기가 될 것 같습니다.


※ 기사 내용 참조

[TheVerge] Google launches Gemini, the AI model it hopes will take down GPT-4 | By David Pierce | Dec 7, 2023, 12:00 AM GMT+9 | https://www.theverge.com/2023/12/6/23990466/google-gemini-llm-ai-model

[Google Blog] Introducing Gemini: our largest and most capable AI model | https://blog.google/technology/ai/google-gemini-ai/#sundar-note

[Google Bard] Gemini를 사용해 볼 수 있는 곳 : https://bard.google.com/


https://pf.kakao.com/_UCxoxnT

 

웨어러블서치

기술이 어디를 향하고 개인과 사회에 어떤 영향을 미치는지 연구합니다.

pf.kakao.com

 

728x90
반응형

관련글 더보기

댓글 영역