Mercury Coder revoluciona IA com geração de texto ultrarrápida

Por Luciano Rodrigues
Imagem: Dall-E

s

  • Mercury Coder é 19x mais rápido que modelos convencionais.
  • Nova abordagem promete mais eficiência sem perder qualidade.
  • Inovação pode impactar produtividade e IA conversacional.

A Inception Labs anunciou, na última quinta-feira (27), o Mercury Coder, um modelo de IA que usa técnicas de difusão para gerar texto de forma mais rápida e eficiente.

Diferente dos modelos tradicionais que criam texto palavra por palavra, o Mercury gera respostas completas simultaneamente, refinando-as de um estado inicialmente mascarado para um texto coerente. Essa abordagem inspirada em modelos de geração de imagem, como Stable Diffusion e DALL-E, permite um processamento mais veloz e fluido.

Mercury Coder promete velocidade e desempenho inigualáveis

Os modelos tradicionais, como o GPT-4o, geram texto de forma autoregressiva, construindo frases um token por vez. Isso gera latência, pois cada palavra depende da anterior. O Mercury Coder elimina essa limitação ao trabalhar com um sistema de redução de ruído, revelando todo o texto de uma vez.

Segundo a Inception Labs, o Mercury Coder alcança uma velocidade de 1.109 tokens por segundo em GPUs Nvidia H100, tornando-o 19 vezes mais rápido que o GPT-4o Mini. Esse desempenho superior também supera modelos otimizados para velocidade, como o Gemini 2.0 Flash-Lite, que atinge apenas 201 tokens por segundo.

O modelo Mercury ainda demonstrou excelente desempenho em benchmarks de codificação, atingindo 88,0% no HumanEval e 77,1% no MBPP, resultados comparáveis ao GPT-4o Mini, mas com velocidade muito superior. Essas melhorias podem revolucionar aplicações como ferramentas de autocompletar código, chatbots e agentes de IA.

CONTINUA APÓS A PUBLICIDADE

A abordagem baseada em difusão envolve múltiplas passagens pela rede neural, mas o processamento paralelo compensa essa demanda. A possibilidade de respostas rápidas pode impactar positivamente a produtividade de desenvolvedores e otimizar interações com IA.

Especialistas do setor vêm essa inovação como uma nova direção promissora para a IA generativa. O ex-pesquisador da OpenAI, Andrej Karpathy, destacou que a abordagem do Mercury Coder pode trazer novos pontos fortes para o desenvolvimento de LLMs.

Este modelo tem o potencial de ser diferente e possivelmente mostrar uma psicologia nova e única, ou novos pontos fortes e fracos. Eu encorajo as pessoas a experimentá-lo!

Atualmente, o modelo Mercury Coder pode ser testado no site de demonstração da Inception Labs, enquanto o código do LLaDA, um modelo semelhante, está disponível no Hugging Face para experimentação aberta.

Compartilhe:
Siga:
Jornalista, assessor de comunicação, escritor e comunicador, com MBA em jornalismo digital e 12 anos de experiência, tendo passado também por alguns veículos no setor tech.
Sair da versão mobile