A parceria entre Boston Dynamics, Google Cloud e Google DeepMind integra os modelos de inteligência artificial Gemini e Gemini Robotics-ER 1.6 à plataforma de inspeção industrial Orbit, especificamente nos sistemas AI Visual Inspection (AIVI) e AIVI-Learning do robô Spot. Essa colaboração, anunciada em 14 de abril de 2026, visa aprimorar a autonomia dos robôs em ambientes reais, permitindo raciocínio mais complexo além de detecção básica. A integração busca expandir tarefas como monitoramento de equipamentos e detecção de riscos em instalações industriais.
Parceria e Integração dos Modelos
Boston Dynamics uniu forças com Google Cloud e Google DeepMind para incorporar os modelos Gemini e Gemini Robotics-ER 1.6 ao software Orbit, focando em AIVI e AIVI-Learning. Essa ação permite que o robô Spot processe imagens de suas câmeras para análises visuais avançadas, conectando-se a ferramentas externas como Google Search e modelos de visão-linguagem-ação (VLA). Desenvolvedores acessam o modelo via Gemini API e Google AI Studio, com exemplos de configuração disponíveis em um notebook Colab.
Na prática, o modelo atua como camada de raciocínio de alto nível, coordenando múltiplos sistemas de IA para tarefas robóticas. Boston Dynamics conecta o Gemini Robotics-ER 1.6 ao Spot SDK e à pipeline AIVI, traduzindo saídas do modelo em comandos de API do robô. Essa estrutura substitui máquinas de estado rígidas por agentes baseados em raciocínio, adaptáveis a aplicações variadas.
Capacidades Aprimoradas de Raciocínio e Análise
O Gemini Robotics-ER 1.6 enfatiza o raciocínio incorporado, melhorando a compreensão espacial, o processamento de múltiplas visões de câmera e a detecção de sucesso em tarefas. Comparado à versão anterior ER 1.5 e ao Gemini 3.0 Flash, o modelo supera benchmarks em precisão de apontamento, contagem de objetos e detecção de conclusão de tarefas. Ele processa feeds de câmeras simultaneamente, correlacionando perspectivas em tempo real, mesmo em ambientes dinâmicos ou obstruídos.
Além disso, a nova capacidade de leitura de instrumentos permite interpretar medidores analógicos, vidros de inspeção e leituras digitais, combinando detecção de objetos, raciocínio espacial e conhecimento contextual. Tarefas como identificar posições de agulhas, marcas de escala e distorções de câmera são executadas autonomamente. Essa funcionalidade, desenvolvida em colaboração com Boston Dynamics, aborda necessidades industriais de monitoramento sem supervisão humana constante.
Aplicações em Inspeções Industriais
Com a integração, o Spot realiza tarefas como responder perguntas sobre instalações baseadas em dados visuais, como detectar portas abertas, derramamentos ou perigos. Demonstrações mostram o robô identificando e organizando objetos, monitorando equipamentos como manômetros e sistemas de transporte, além de auditorias de segurança. AIVI-Learning acumula aprendizado específico de instalações, suportando análises como conformidade 5S, contagem de paletes e medição de níveis em vidros de inspeção de 0 a 100%.
Em seguida, o sistema oferece consciência holística do local, identificando riscos precocemente e automatizando tarefas que demandariam trabalhadores humanos em múltiplos turnos. Atualizações de modelos ocorrem via nuvem sem interrupções, denominadas zero-downtime upgrades. Isso melhora a precisão em inspeções críticas, como leituras de displays digitais e detecção de alavancas ou presença de objetos.
Considerações de Transparência, Segurança e Implementação
Boston Dynamics destaca o raciocínio transparente, permitindo que usuários visualizem como a IA chega a conclusões, atendendo preocupações de accountability em ambientes regulados. O AIVI-Learning requer compartilhamento de dados de clientes para treinamento e adaptação, com informações compartilhadas apenas com Boston Dynamics. O sistema agora está disponível para clientes existentes da plataforma, após rollout no início do mês.
A segurança é priorizada, com o ER 1.6 descrito como o modelo mais seguro da DeepMind até o momento, melhorando conformidade em tarefas de raciocínio espacial adversarial. Carolina Parada, head de robótica na Google DeepMind, enfatiza avaliações baseadas em padrões humanos para qualidade de raciocínio. Marco da Silva, vice-presidente e gerente geral do Spot na Boston Dynamics, afirma que capacidades como leitura de instrumentos e raciocínio confiável habilitam operação autônoma completa em desafios reais.
Tendências Mais Amplas na Robótica
Essa parceria reflete uma tendência na indústria de combinar máquinas físicas com modelos de IA em grande escala para maior autonomia e adaptabilidade. Empresas movem-se além de comportamentos pré-programados para sistemas que interpretam ambientes complexos, tomam decisões e aprendem ao longo do tempo. Exemplos incluem colaborações como a de Agile Robots com Google DeepMind, trocando dados de implantações reais em manufatura de eletrônicos e produção de veículos elétricos.
O mercado de robótica industrial, avaliado em cerca de 200 bilhões de dólares, é impulsionado por escassez de mão de obra e pressões na cadeia de suprimentos. Desafios reais, como iluminação variável e objetos inesperados, testarão o desempenho em campo, determinando a adoção comercial. Indústrias como manufatura, logística, saúde e energia beneficiam-se de tarefas de inspeção, monitoramento e automação mais independentes. Para mais detalhes sobre a integração, consulte o anúncio da Boston Dynamics com Google DeepMind.


