구글이 자사의 최첨단 인공지능 로봇 기술을 한 단계 끌어올렸습니다. 지난 3월, 멀티모달 인공지능 모델인 ‘Gemini 2.0’을 기반으로 한 ‘Gemini Robotics’를 공개한 데 이어, 이제는 네트워크 연결 없이 로봇 자체에서 실행 가능한 ‘Gemini Robotics On-Device’를 새롭게 발표했습니다.
‘Gemini Robotics On-Device’는 VLA(Vision-Language-Action) 기반 모델로, 시각적 정보와 언어, 동작을 통합적으로 이해하고 처리할 수 있는 기술입니다. 특히 이 모델은 로봇 자체에 내장되어 실행되도록 설계되어, 네트워크 연결이 불안정하거나 지연 시간이 민감한 환경에서도 안정적인 동작이 가능합니다.
구글은 이 모델이 다양한 작업을 빠르게 학습하고 일반화하는 능력을 갖추고 있습니다. 예를 들어, 가방의 지퍼를 열거나 옷을 접는 등 정밀한 조작이 필요한 작업도 자연어 명령을 이해하고 직접 수행할 수 있습니다.
구글은 이번 발표와 함께 ‘Gemini Robotics SDK’를 공개하여, 개발자들이 자신들의 로봇 환경에서 모델을 쉽게 테스트하고 새로운 작업에 맞게 미세 조정할 수 있도록 지원합니다. 특히 50~100개의 데모만으로도 새로운 작업에 빠르게 적응하는 학습 효율성을 보입니다.
이 SDK는 구글의 물리 시뮬레이터인 MuJoCo와도 호환되어, 현실에 가까운 환경에서 모델의 성능을 평가하고 적용 가능성을 검토할 수 있습니다. SDK는 구글의 ‘Trusted Tester Program’을 통해 선별된 개발자들에게 우선 제공됩니다.
‘Gemini Robotics On-Device’는 구글의 ALOHA 로봇을 기반으로 훈련되었지만, 프랑카(Franka FR3)와 같은 양팔 산업용 로봇, 인간형 로봇 아폴로(Apptronik Apollo) 등 다양한 하드웨어 플랫폼으로도 확장 적용이 가능합니다.
프랑카 로봇에서는 미리 보지 못한 물체를 다루거나 산업용 벨트 조립과 같은 고난도 작업을 수행했고, 아폴로 로봇에서는 자연어 명령을 따라 낯선 환경과 물체를 유연하게 조작할 수 있었습니다.
아래 차트는 Gemini Robotics On-Device가 다양한 상황에 얼마나 잘 적응하는지를 보여줍니다. 구글의 대표 모델인 Gemini Robotics와 이전에 가장 성능이 좋았던 온디바이스 모델과 비교한 결과입니다.
다음 차트는 Gemini Robotics On-Device가 사람의 말이나 지시를 얼마나 잘 따르는지를 평가한 것입니다. 역시 Gemini Robotics와 기존 최고 성능의 온디바이스 모델과 비교한 결과입니다.
마지막 차트는 Gemini Robotics On-Device가 100개도 안 되는 예시만 보고도 새로운 작업에 얼마나 빠르게 적응하는지를 보여줍니다.
구글은 Gemini Robotics의 모든 모델을 자사의 AI 윤리 원칙에 기반해 개발하고 있으며, 의미적(Semantic) 및 물리적 안전성을 아우르는 포괄적인 안전 접근 방식을 적용하고 있습니다. 특히, 실행 단계에서 저수준 안전 컨트롤러와의 연동을 통해 위험을 방지하고, 모델의 안전 취약점을 사전에 탐색하기 위한 Red-Teaming 절차도 권장하고 있습니다.
구글의 책임 있는 개발 및 혁신(ReDI) 팀은 Gemini Robotics의 사회적 영향력을 분석하고 있으며, 그 평가 결과는 ‘책임 및 안전 위원회(RSC)’의 검토를 거쳐 모델 개발에 반영됩니다.
‘Gemini Robotics On-Device’는 로봇의 응답 속도, 연결성 문제를 해결하는 한편, 현장에서 바로 실행 가능한 차세대 로봇 AI 모델로서 주목받고 있습니다. 구글은 이번 기술이 로보틱스 커뮤니티의 혁신을 가속화할 수 있는 중요한 도구가 될 것이라며, 앞으로 더욱 다양한 응용 분야에서의 활용을 기대하고 있습니다.
SDK와 모델은 현재 신뢰할 수 있는 테스터 그룹을 통해 제한적으로 제공되고 있으며, 향후 공개 범위를 점차 확대할 예정입니다.
※ 기사 내용 참조
[Google Deepmind] Gemini Robotics On-Device brings AI to local robotic devices | by Carolina Parada | 24 June 2025 | https://deepmind.google/discover/blog/gemini-robotics-on-device-brings-ai-to-local-robotic-devices/
웨어러블서치
기술이 어디를 향하고 개인과 사회에 어떤 영향을 미치는지 연구합니다.
pf.kakao.com
삼성 갤럭시 Z 폴드/플립 7, 7월 9일 공개! 역대급으로 얇다?! (1) | 2025.06.30 |
---|---|
HDMI 2.2 Ultra96 케이블로 바뀌는 16K 미디어 세상 (0) | 2025.06.26 |
iOS 26 베타 2, 제어 센터 가독성 UP! 새로운 벨소리 추가! (2) | 2025.06.24 |
애플, 퍼플렉시티 AI 인수 검토…‘시리’가 똑똑해질까? (1) | 2025.06.23 |
아이폰으로 찍었다고? F1 더 무비에 숨겨진 애플의 '커스텀 카메라' 정체 (6) | 2025.06.20 |
댓글 영역