O Google soltou o Omni Flash, um modelo multimodal que processa texto, imagem e áudio numa tacada só, com latência baixa e preço de banana. Parece atualização incremental, mas não é: a graça está em colocar capacidades que antes exigiam APIs separadas dentro de um único endpoint barato o suficiente pra rodar em produção sem assustar o financeiro.
O movimento pressiona OpenAI, Anthropic e companhia, que ainda cobram caro por multimodalidade decente. Não é que o Omni Flash seja o melhor em tudo — não é —, mas ele resolve o problema do desenvolvedor médio, que quer algo bom o bastante e barato o suficiente. E nesse jogo, escala importa mais que benchmark.
Via AI For Humans.
Fonte: AI For Humans – The Newsletter · Imagem de capa: AI For Humans – The Newsletter