A Allen Institute for AI (Ai2), organização de pesquisa fundada pelo cofundador da Microsoft Paul Allen, lançou a nova família de modelos de linguagem OLMo 2, projetada com foco em transparência e acessibilidade.
Os modelos seguem rigorosamente a definição de código aberto estabelecida pela Open Source Initiative, garantindo que todos os dados, ferramentas e métodos de treinamento estejam disponíveis para o público.
A série OLMo (sigla para “Open Language Model”) já havia iniciado esse compromisso com a abertura em fevereiro, e agora, com o OLMo 2, a Ai2 introduz duas versões: o OLMo 7B, com 7 bilhões de parâmetros, e o OLMo 13B, com 13 bilhões de parâmetros.
Esses números indicam a capacidade dos modelos de lidar com tarefas complexas, com um desempenho que promete rivalizar com soluções proprietárias, como o Llama 3.1 da Meta.
OLMo 2 busca democratizar acesso a IA, apesar dos riscos
A Ai2 utilizou um conjunto de dados massivo, composto por 5 trilhões de tokens, para treinar os modelos.
Esses tokens incluem informações de sites, artigos acadêmicos, fóruns de perguntas e respostas e até livros de matemática, selecionados e filtrados para garantir alta qualidade.
O processo resultou em modelos capazes de realizar tarefas como responder perguntas, resumir textos e escrever código, entre outras aplicações baseadas em texto.
Em testes de desempenho, o OLMo 2 7B superou o Llama 3.1 8B, consolidando-se como uma alternativa competitiva no cenário de IA aberta.
Todos os componentes do OLMo 2 estão disponíveis sob a licença Apache 2.0, permitindo seu uso comercial sem restrições significativas.
A abertura total dos modelos levantou preocupações sobre possíveis usos indevidos, como o desenvolvimento de ferramentas militares.
Dirk Groeneveld, engenheiro da Ai2, reconheceu esses riscos, mas argumentou que os benefícios superam os potenciais danos.
Ele destacou que a abertura promove avanços éticos, maior verificação técnica e redução da concentração de poder no setor.
Com o OLMo 2, a Ai2 busca equilibrar inovação tecnológica com acessibilidade, fornecendo ferramentas para desenvolvedores e pesquisadores explorarem novas possibilidades na inteligência artificial.
O lançamento reforça a importância de um ecossistema aberto e colaborativo em um campo dominado por grandes corporações.