"학습되지 않은 작업도 척척" 구글 딥마인드, 로봇 AI 모델 ‘제미나이 로보틱스’ 공개

 사진 : 제미나이 로보틱스 (출처=Google)

사진 : 제미나이 로보틱스 (출처=Google)

구글 딥마인드가 13일(현지시간) 새로운 로봇 AI 모델인 ‘제미나이 로보틱스(Gemini Robotics)’와 ‘제미나이 로보틱스-ER’을 발표했다.

이 모델들은 로봇이 주변 환경을 인식하고 보다 정밀하게 상호작용할 수 있도록 설계됐다. 특히 제미나이 로보틱스는 ‘비전-언어-행동(VLA)’ 능력을 갖춰 시각 정보 처리와 언어 명령 이해, 물리적 동작 생성 등이 가능하며, 제미나이 로보틱스-ER은 ‘공간 추론’을 강화해 기존 로봇 제어 시스템과의 연계를 지원한다.

이를 통해 로봇이 단순한 물체 인식과 조작을 넘어, 복잡한 작업을 수행할 수 있도록 돕는다. 예를 들어, 카메라로 바나나를 인식해 바구니에 넣거나, 종이접기를 통해 여우 모양을 만드는 등의 섬세한 동작이 가능해진다.

구글 딥마인드는 지난 2023년 발표한 로봇 AI 모델 ‘RT-2’ 대비 이번 제미나이 로보틱스가 일반화 능력을 대폭 향상시켰다고 밝혔다. RT-2는 인터넷 데이터를 활용해 새로운 환경에서도 언어 명령을 이해했지만, 실제 물리적 조작에서는 한계를 보였다. 반면, 제미나이 로보틱스는 학습되지 않은 새로운 작업도 수행할 수 있으며, 이전 모델 대비 성능이 두 배 이상 향상됐다는 설명이다.

사진 : 앱트로닉의 휴머노이드 아폴로
사진 : 앱트로닉의 휴머노이드 아폴로

구글은 이번 AI 모델을 활용해 인간형 로봇 개발에도 박차를 가하고 있다. 미국 텍사스에 본사를 둔 로봇 기업 앱트로닉(Apptronik)과 협력해 ‘제미나이 2.0’을 기반으로 한 차세대 휴머노이드 로봇을 개발 중이다. 또한 보스턴 다이내믹스, 애질리티 로보틱스 등 주요 로봇 기업에도 제한적으로 제미나이 로보틱스-ER을 제공해 연구를 지원할 예정이다.

로봇 안전성 문제도 고려됐다. 구글은 아이작 아시모프(Isaac Asimov)의 ‘로봇 3원칙’에서 영감을 받아 ‘로봇 헌법(Robot Constitution)’이라는 새로운 안전 프레임워크를 구축하고, 로봇 행동의 안전성을 평가할 수 있는 ‘ASIMOV’ 데이터셋을 공개했다. 이를 통해 로봇이 수행하는 행동의 잠재적 위험성을 분석하고, 보다 신뢰할 수 있는 AI 기반 로봇을 개발한다는 계획이다.

다만, 제미나이 로보틱스의 상용화 일정이나 구체적인 활용 방안은 아직 공개되지 않았다. 구글이 공개한 시연 영상에서는 AI가 복잡한 조작을 수행하는 모습을 보여줬지만, 실제 환경에서 얼마나 안정적으로 작동할지는 여전히 검증이 필요하다.

다음 이전

POST ADS1

POST ADS 2