Google AI Lança Veo 3.1 Lite: Oferecendo Geração de Vídeo de Baixo Custo e Alta Velocidade para Desenvolvedores Através da Gemini API

O Google anunciou o lançamento do Veo 3.1 Lite, um novo nível de modelo dentro de seu portfólio de vídeo generativo, projetado para resolver o principal gargalo para implantações em escala de produção: precificação. Embora o espaço de vídeo generativo tenha visto um rápido progresso na fidelidade visual, o custo por segundo de conteúdo gerado permaneceu alto, muitas vezes proibitivo para desenvolvedores que criam aplicações de alto volume. O Veo 3.1 Lite agora está disponível via Gemini API e Google AI Studio para usuários da categoria paga. Ao oferecer a mesma velocidade de geração que o modelo Veo 3.1 Fast existente, com aproximadamente metade do custo, o Google está posicionando este modelo como o padrão para desenvolvedores focados em geração de vídeo programática e prototipagem iterativa. https://blog.google/innovation-and-ai/technology/ai/veo-3-1-lite/ Arquitetura Técnica: O Diffusion Transformer (DiT) O aspecto mais significativo da família Veo 3.1 é sua arquitetura subjacente Diffusion Transformer (DiT). Modelos de vídeo generativos tradicionais frequentemente dependiam de difusão baseada em U-Net, que pode ter dificuldades com dados de alta dimensão e dependências temporais de longo alcance. O Veo 3.1 Lite utiliza um backbone baseado em transformer que opera em patches espaço-temporais. Nesta arquitetura, os quadros de vídeo não são processados como imagens 2D estáticas, mas como uma sequência contínua de tokens em um espaço latente. Ao aplicar autoatenção em todos esses patches, o modelo mantém melhor consistência temporal. Isso garante que objetos, iluminação e texturas permaneçam coerentes durante a duração do clipe, reduzindo os artefatos comumente vistos em modelos anteriores. O modelo executa sua computação em um espaço latente compactado, em vez de um espaço de pixel. Isso permite que o modelo lide com as altas demandas computacionais da geração de vídeo, mantendo um menor uso de memória. Para os desenvolvedores, isso se traduz em um modelo que pode gerar conteúdo de alta definição sem o aumento exponencial no tempo de computação que geralmente acompanha o dimensionamento de resolução. Desempenho e Especificações de Saída O Veo 3.1 Lite oferece parâmetros específicos para resolução e duração, permitindo que desenvolvedores de AI o integrem em fluxos de trabalho estruturados. Diferente do modelo Veo 3.1 principal, que suporta resolução 4K, a versão Lite é otimizada para saídas de alta definição (HD). Resoluções Suportadas: 720p e 1080p. Proporções: Suporte nativo para orientações paisagem (16:9) e retrato (9:16). Durações de Clipe: Os desenvolvedores podem especificar durações de geração de 4, 6 ou 8 segundos.