상세 컨텐츠

본문 제목

챗GPT 돌고래 버전? 구글, 돌고래와 대화하는 AI '돌핀젬마' 공개!

IT 소식

by 웨어러블서치 2025. 4. 15. 03:48

본문

반응형

DolphinGemma will get its first test run this summer.

돌핀젬마는 이번 여름에 첫 번째 테스트를 실시할 예정입니다.


사진출처) Wild Dolphin Project (WDP)

 

 

돌고래는 지구상에서 가장 지능이 높은 동물 중 하나로 입니다. 서로 협력하고, 새로운 기술을 가르치며, 심지어 거울에 비친 자신의 모습을 인식하는 능력까지 갖추고 있습니다. 과학자들은 수십 년 동안 돌고래가 의사소통에 사용하는 복잡한 휘파람 소리와 딸깍거리는 소리 등 '돌고래 소리'의 비밀을 풀기 위해 노력해왔습니다.

 

그리고 이제, 구글(Google)의 최첨단 AI 기술과 야생 돌고래 프로젝트(Wild Dolphin Project, 이하 WDP)라는 환경단체가 연합하여 돌고래가 내는 소리에 대한 연구에 새로운 돌파구가 마련될 것 같습니다.


사진출처) 구글 돌핀젬마

 

30년 이상 돌고래를 연구해 온 WDP와 구글의 만남

 

1985년부터 WDP는 비침습적인 방법으로 대서양 알락돌고래(Atlantic spotted dolphin) 무리를 추적하며 그들의 행동과 소리를 기록해왔습니다. 방대한 비디오 및 오디오 데이터와 함께 돌고래의 행동을 상세히 기록하며, WDP는 돌고래의 발성 방식과 사회적 상호작용 사이의 연관성을 밝히는 것을 목표로 하였습니다.

 

수십 년간 축적된 수중 녹음 자료 분석을 통해 연구자들은 몇 가지 중요한 발견을 했습니다. 예를 들어, 대서양 알락돌고래는 마치 이름처럼 사용되는 고유한 '시그니처 휘슬(signature whistle)'을 가지고 있어 특정 개체끼리 서로를 식별하고 찾을 수 있다는 것입니다. 또한, 돌고래들이 다툴 때는 일정한 패턴의 '찍찍거리는(squawk)' 소리를 낸다는 사실도 밝혀냈습니다.

 

WDP의 연구 책임자인 데니스 헤르징(Denise Herzing) 박사는 "돌고래의 발성 구조와 패턴을 이해하는 것은 그들의 의사소통이 과연 '언어'의 수준에 도달했는지 확인하는 데 필수적"이라고 말합니다. 궁극적인 목표는, 만약 돌고래의 언어가 실제로 존재한다면, 그들과 직접 소통할 수도 있다는 것 입니다. 이러한 목표를 위해 WDP는 레이블링된 방대한 데이터셋을 구축했고, 바로 이 데이터가 구글의 생성형 AI 기술과 만나 시너지를 이루고 있습니다.


 

사진출처) WDP ❘ 돌고래 소리

 

돌고래 언어 해독의 열쇠, '돌핀젬마(DolphinGemma)'

 

우리가 흔히 접하는 대규모 언어 모델(LLM)은 기본적으로 패턴을 예측하는 데 탁월한 능력을 보입니다. 사용자가 질문이나 명령을 입력하면, 모델은 가장 확률 높은 다음 단어(토큰)를 예측하는 과정을 반복하여 마치 사람이 쓴 것 같은 자연스러운 문장을 만들어 줍니다.

 

구글과 WDP는 '돌핀젬마'를 통해 이러한 원리를 해양 포유류의 소리에도 적용하고자 합니다. 돌핀젬마는 구글의 개방형 AI 모델인 '젬마(Gemma)'를 기반으로 하며, 구글이 개발한 '사운드스트림(SoundStream)'이라는 오디오 처리 기술을 사용합니다. 사운드스트림은 돌고래의 복잡한 발성을 AI가 이해할 수 있는 작은 단위, 즉 '토큰'으로 변환하는 역할을 합니다.

 

WDP가 수십 년간 축적한 방대한 돌고래 소리 아카이브를 학습 데이터로 사용한 돌핀젬마는 '오디오 입력, 오디오 출력' 방식으로 작동합니다. 즉, 특정 돌고래의 소리를 입력하면, 인간 언어 모델처럼 다음번에 나올 가능성이 높은 돌고래 소리(토큰)를 예측합니다. 만약 이 예측이 성공적으로 이루어진다면, 이는 돌고래가 이해할 수 있는 의미 있는 소리의 패턴을 찾아내는 중요한 단서가 될 수 있습니다.

 

연구팀은 돌핀젬마가 인간의 귀로는 식별하기 어려운 복잡한 소리 패턴 속에서 '공유된 어휘(shared vocabulary)'의 존재를 밝혀내는 데 도움이 될 것 같습니다. 인간이 직접 이 방대한 데이터를 분석하는 것은 거의 불가능에 가까운 일이기 때문입니다.


사진출처) 구글 ❘ 픽셀9 기반의 CHAT

 

현장 연구를 위한 최적화: Pixel 휴대전화와 만나다

 

구글은 WDP 연구원들이 실제 야생 환경에서 연구를 진행한다는 점을 고려하여 돌핀젬마를 설계했습니다. 연구팀은 현장에서 구글 픽셀(Pixel) 스마트폰을 사용하기 때문에, AI 모델 역시 제한된 자원 하에서도 효율적으로 작동해야 합니다. 일반적으로 AI 모델은 크고 강력할수록 더 많은 메모리(RAM)와 처리 능력을 요구하지만, 돌핀젬마는 약 4억 개의 파라미터(매개변수)로 구성되어 일반적인 LLM에 비해 상대적으로 가볍게 설계되었습니다.

 

WDP는 지난 몇 년간 조지아 공과대학교(Georgia Tech College)에서 개발한 'CHAT(Cetacean Hearing and Telemetry)'라는 장비를 사용해왔습니다. 픽셀 6 스마트폰을 기반으로 제작된 이 장비는 수중에서 돌고래의 소리를 듣고, 특정 소리를 합성하여 물체와 연관시키려는 시도나 돌고래의 소리를 모방하는 응답을 하는 데 사용하고 있었습니다.

 

구글은 2025년 여름 연구 시즌에 맞춰 새롭게 업그레이드 된 '픽셀 9' 기반의 CHAT 장비를 선보일 예정이라고 합니다. 업그레이드된 CHAT 장비는 돌핀젬마 등 딥러닝 모델과 기존의 템플릿 매칭 알고리즘을 동시에 실행할 수 있어 더욱 정교한 연구가 가능해질 것 같습니다. 아직 연구팀은 아직 돌핀젬마가 생성한 소리를 CHAT 장비를 통해 즉시 돌고래에게 들려주는 단계까지는 고려하고 있지 않습니다. 돌핀젬마를 통한 분석과 CHAT을 활용한 상호작용에 대한 실험이 함께 진행 될 것으로 보입니다.

 


 

미래를 향한 열린 가능성: 오픈 액세스와 확장성

 

물론 돌핀젬마와 새로운 CHAT 장비가 즉시 인간과 돌고래 간의 자유로운 대화를 가능하게 하지는 않을 것입니다. 하지만 시간이 지남에 따라 돌고래 소리에 대한 이해도가 높아지고, 기본적인 상호작용의 가능성을 열어줄 수 있을 것으로 기대됩니다.

 

인간 언어 모델인 젬마처럼, 돌핀젬마 역시 공개 프로젝트로 진행됩니다. 구글은 올여름, 전 세계 연구자들이 활용할 수 있도록 돌핀젬마 모델을 공개할 예정입니다. 비록 대서양 알락돌고래의 소리를 기반으로 학습되었지만, 약간의 미세 조정을 통해 다른 고래류 종의 소리 연구에도 적용될 수 있을 것 같습니다.

 

구글의 AI 기술과 WDP의 오랜 연구 열정이 만난 돌핀젬마 프로젝트. 아직은 시작 단계이지만, 돌고래의 신비로운 언어를 해독하고 그들과 소통하려는 인류의 오랜 꿈에 한 걸음 더 다가가는 중요한 이정표가 될 것입니다. 앞으로 돌핀젬마가 돌고래 세계의 비밀을 조금씩 알아내지 않을까 합니다.

 

 


 

※ 기사 내용 참조

 

[Ars Technica ] Google created a new AI model for talking to dolphins | Ryan Whitwam | April 14, 2025 at 10:00 PM | https://arstechnica.com/science/2025/04/google-created-a-new-ai-model-for-talking-to-dolphins/

 

[Georgia Tech College of Computing | YouTube] Exploring Wild Dolphin Communication with C.H.A.T. (Cetacean Hearing Augmented Telemetry) | https://youtu.be/YhopeQKbpZA

 

[Google | YouTube] DolphinGemma: How Google AI is helping decode dolphin communication | https://youtu.be/T8GdEVVvXyE

 


https://pf.kakao.com/_UCxoxnT

 

웨어러블서치

기술이 어디를 향하고 개인과 사회에 어떤 영향을 미치는지 연구합니다.

pf.kakao.com

 

728x90
반응형

관련글 더보기

댓글 영역