- Modelo roda no próprio robô, sem precisar de internet.
- Funciona com apenas 50 a 100 demonstrações de tarefas.
- Google lança SDK para desenvolvedores ajustarem o modelo.
O Google DeepMind anunciou o Gemini Robotics On-Device, uma nova versão de seu modelo de inteligência artificial que permite que robôs operem totalmente offline, sem conexão com a internet. A solução leva as capacidades do modelo VLA (visão, linguagem e ação) diretamente para o hardware. Isso otimiza tarefas que exigem baixa latência e alta precisão.
O lançamento marca um avanço significativo no desenvolvimento de IA para robótica. Segundo o Google, o modelo oferece destreza para tarefas gerais, alta capacidade de generalização e adaptação rápida, mesmo em ambientes sem conectividade.
Robôs mais inteligentes, rápidos e offline
O Gemini Robotics On-Device permite que robôs executem ações complexas. Ações como fechar zíperes, dobrar roupas e realizar montagem industrial, além de seguir instruções em linguagem natural. Tudo isso funciona localmente, sem depender da nuvem. Isso melhora a velocidade e a robustez do sistema.
O modelo também se adapta facilmente. Por exemplo, com apenas 50 a 100 demonstrações, ele aprende novas tarefas. Além disso, funciona em diferentes tipos de robôs, como o ALOHA, o humanoide Apollo da Apptronik e o Franka FR3 de dois braços.
Por fim, o Google lançou um SDK (kit de desenvolvimento de software), permitindo que desenvolvedores ajustem o modelo, façam testes em simuladores físicos como o MuJoCo e o adaptem rapidamente a diferentes ambientes e plataformas.
O Google destaca que todo o desenvolvimento do Gemini Robotics segue seus Princípios de IA, priorizando segurança semântica, física e controle de riscos. O sistema se conecta a controladores de segurança de baixo nível. Além disso, é avaliado constantemente pela equipe de Desenvolvimento e Inovação Responsável (ReDI) e pelo Conselho de Responsabilidade e Segurança (RSC).
Por enquanto, o acesso ao modelo e ao SDK está restrito a um grupo de testadores confiáveis, enquanto o Google coleta feedback e aprimora a tecnologia.
