O MIT (Massachusetts Institute of Technology) presentou um modelo inovador de treinamento para robôs, baseado em princípios de inteligência artificial de grande escala.
Abandonando o método tradicional que se apoia em conjuntos específicos de dados, os pesquisadores buscaram uma abordagem mais ampla e versátil, inspirada nos grandes modelos de linguagem (LLMs), como o GPT-4.
Essa nova estratégia tem como objetivo preparar os robôs para lidar com mudanças e desafios inesperados em seus ambientes de atuação.
Segundo a equipe de pesquisadores, o método de aprendizado por imitação, que ensina robôs a executarem tarefas observando outras ações, tem limitações.
Pequenas variações como iluminação diferente, novos obstáculos ou mudanças no cenário podem dificultar o desempenho dos robôs, pois os dados que eles têm disponíveis são insuficientes para adaptações rápidas.
Por esse motivo, o MIT se voltou para uma técnica que incorpora a força bruta de dados, similar à usada nos LLMs, para expandir a capacidade de aprendizado dos robôs.
MIT apresenta Heterogeneous Pretrained Transformers (HPT)
A solução encontrada pela equipe do MIT foi a criação de uma arquitetura de aprendizado denominada Heterogeneous Pretrained Transformers (HPT).
Esse modelo é projetado para integrar dados provenientes de múltiplos sensores e diversos ambientes, unindo-os em um único transformador que processa e analisa esses dados.
Quanto maior o transformador, mais eficaz o resultado, possibilitando que os robôs aprendam e se adaptem a situações variadas com uma precisão aprimorada.
De acordo com Lirui Wang, o principal autor do estudo, a robótica enfrenta um desafio adicional pela heterogeneidade dos dados que necessita processar:
Na robótica, dada toda a heterogeneidade nos dados, se você quiser pré-treinar de maneira semelhante [aos LLMs], precisamos de uma arquitetura diferente.
O novo método permite que usuários insiram características específicas do robô, configurações e objetivos para que a máquina aprenda a realizar tarefas com mínima necessidade de treinamento extra.
Para David Held, professor da Carnegie Mellon University e pesquisador envolvido no projeto, o objetivo é criar um “cérebro robótico universal”, que possa ser utilizado em qualquer robô.
Embora ainda esteja nos primeiros estágios, a equipe acredita que a ampliação do modelo pode resultar em avanços semelhantes aos obtidos por grandes modelos de linguagem.
Essa pesquisa recebeu apoio do Toyota Research Institute, que, em parceria com o MIT e a Boston Dynamics, busca integrar o aprendizado avançado de robôs com novos hardwares, ampliando as possibilidades de aplicações industriais e comerciais para esses autômatos inteligentes.