Liquid AI Lança LFM2.5-VL-450M: Um Modelo Visão-Linguagem de 450M de Parâmetros com Predição de Bounding Box, Suporte Multilíngue e Inferência Edge Abaixo de 250ms
A Liquid AI acaba de lançar o LFM2.5-VL-450M, uma versão atualizada de seu modelo de visão-linguagem anterior, o LFM2-VL-450M. A nova versão introduz previsão de bounding box, melhoria no seguimento de instruções, compreensão multilíngue expandida e suporte a chamada de função — tudo isso dentro de uma pegada de 450M de parâmetros projetada para rodar diretamente em hardware de edge, desde módulos de AI embarcada como o NVIDIA Jetson Orin,
Pesquisadores do MIT, NVIDIA e Universidade de Zhejiang Propõem TriAttention: Um Método de Compressão de Cache KV Que se Equipara à Atenção Completa com Vazão 2,5 Vezes Maior
O raciocínio de cadeia longa é uma das tarefas mais intensas em termos de computação nos modelos de linguagem grande modernos. Quando um modelo como DeepSeek-R1 ou Qwen3 resolve um problema matemático complexo, ele pode gerar dezenas de milhares de tokens antes de chegar a uma resposta. Cada um desses tokens deve ser armazenado no que é chamado de cache KV […] O post Pesquisadores do MIT, NVIDIA e Universidade de Zhejiang Propõem
Como Construir um Runtime de Agente Local-First Seguro com OpenClaw Gateway, Habilidades e Execução Controlada de Ferramentas
Neste tutorial, construímos e operamos um runtime OpenClaw totalmente local e válido por esquema. Configuramos o gateway OpenClaw com vinculação de loopback estrita, configuramos o acesso autenticado ao modelo por meio de variáveis de ambiente e definimos um ambiente de execução seguro usando a ferramenta exec integrada. Em seguida, criamos uma habilidade personalizada estruturada que o agente OpenClaw pode descobrir e […] O post Como Construir
Como a Destilação de Conhecimento Comprime a Inteligência de Ensembles em um Único Modelo de AI Implementável
Problemas complexos de previsão frequentemente levam a ensembles porque a combinação de múltiplos modelos melhora a acurácia, reduzindo a variância e capturando padrões diversos. No entanto, esses ensembles são pouco práticos em produção devido a restrições de latência e complexidade operacional. Em vez de descartá-los, a Destilação de Conhecimento (Knowledge Distillation) oferece uma abordagem mais inteligente: manter o ensemble como um professor e treinar um modelo estudante menor
Tongyi Lab da Alibaba Lança VimRAG: um Framework RAG Multimodal que Usa um Grafo de Memória para Navegar em Contextos Visuais Massivos
A Geração Aumentada por Recuperação (RAG) se tornou uma técnica padrão para fundamentar grandes modelos de linguagem em conhecimento externo — mas no momento em que você vai além do texto simples e começa a misturar imagens e vídeos, toda a abordagem começa a falhar. Dados visuais são pesados em tokens, semanticamente esparsos em relação a uma consulta específica e rapidamente se tornam inadministráveis durante várias etapas [...] A postagem Alibaba'
Um Guia de Programação para Cinemática Humana 3D sem Marcadores com Pose2Sim, RTMPose e OpenSim
Neste tutorial, construímos e executamos um pipeline Pose2Sim completo no Colab para entender como a cinemática 3D sem marcadores funciona na prática. Começamos com a configuração do ambiente, configuramos o projeto para o ambiente de execução "headless" do Colab e, em seguida, passamos pela calibração, estimativa de pose 2D, sincronização, associação de pessoas, triangulação, filtragem, aumento de marcadores e cinemática baseada em OpenSim. À medida que avançamos,
NVIDIA Lança AITune: Um Toolkit de Inferência de Código Aberto Que Encontra Automaticamente o Backend de Inferência Mais Rápido Para Qualquer Modelo PyTorch
A implantação de um modelo de deep learning em produção sempre envolveu uma dolorosa lacuna entre o modelo que um pesquisador treina e o modelo que realmente executa eficientemente em escala. TensorRT existe, Torch-TensorRT existe, TorchAO existe — mas conectá-los, decidir qual backend usar para qual camada, e validar que o modelo ajustado ainda produz […] A publicação NVIDIA Lança AITune: A
Cinco Arquiteturas de Computação de IA que Todo Engenheiro Deveria Conhecer: CPUs, GPUs, TPUs, NPUs e LPUs Comparados
A IA moderna não é mais alimentada por um único tipo de processador — ela opera em um ecossistema diversificado de arquiteturas de computação especializadas, cada uma fazendo escolhas deliberadas entre flexibilidade, paralelismo e eficiência de memória. Enquanto os sistemas tradicionais dependiam fortemente de CPUs, as cargas de trabalho de IA atuais estão distribuídas entre GPUs para computação paralela massiva, NPUs para inferência eficiente em dispositivos, e [&#
Um Guia de Codificação Completa do NVIDIA KVPress para Inferência de LLM de Contexto Longo, Compressão de KV Cache e Geração com Uso Eficiente de Memória
Neste tutorial, abordamos de forma detalhada e prática o NVIDIA KVPress e entendemos como ele pode tornar a inferência de modelos de linguagem de contexto longo mais eficiente. Começamos configurando o ambiente completo, instalando as bibliotecas necessárias, carregando um modelo Instruct compacto e preparando um fluxo de trabalho simples que é executado no Colab, enquanto demonstra o […] A postagem Um Guia Completo
ChatGPT para equipes de operações
Descubra como as equipes de operações usam o ChatGPT para otimizar fluxos de trabalho, melhorar a coordenação, padronizar processos e acelerar a execução.
AI Weekly Edição #482: A IA agora é a arma e o alvo: as coisas estão ficando realmente sérias
Quatro vetores de ataque, uma semana. Os pacotes npm dos quais seu aplicativo depende foram comprometidos por um estado-nação. Um data center teve suas coordenadas GPS publicadas por um militar. Agentes de IA foram transformados em armas para espionagem. E modelos de fronteira aprenderam a mentir para se protegerem do desligamento. Não são hipóteses – eles têm números CVE, relatórios de atribuição e imagens de satélite.
ChatGPT para equipes de sucesso do cliente
Descubra como as equipes de Customer Success usam o ChatGPT para gerenciar contas, aprimorar a comunicação, reduzir o churn e impulsionar a adoção e as renovações.
ChatGPT para pesquisa
Aprenda como usar o ChatGPT para pesquisa para coletar fontes, analisar informações e criar insights estruturados e com base em citações.
Uso responsável e seguro de IA
Aprenda a usar a IA de forma responsável com as melhores práticas de segurança, precisão e transparência ao utilizar ferramentas como o ChatGPT.
Usando habilidades
Aprenda como criar e usar habilidades do ChatGPT para construir fluxos de trabalho reutilizáveis, automatizar tarefas recorrentes e garantir resultados consistentes e de alta qualidade.
ChatGPT para equipes de marketing
Descubra como as equipes de marketing usam o ChatGPT para planejar campanhas, gerar conteúdo, analisar desempenho e passar de ideias à execução mais rapidamente.
Nossa resposta ao comprometimento da ferramenta de desenvolvedor Axios
A OpenAI responde ao ataque à cadeia de suprimentos da Axios rotacionando certificados de assinatura de código do macOS, atualizando aplicativos e confirmando que nenhum dado de usuário foi comprometido.
Escrevendo com ChatGPT
Aprenda como usar o ChatGPT para escrita para rascunhar, revisar e refinar conteúdo com estrutura, tom e intenção claros.
Usando GPTs personalizados
Aprenda a construir e usar GPTs personalizados para automatizar fluxos de trabalho, manter saídas consistentes e criar assistentes de IA de propósito específico.
Usando projetos no ChatGPT
Aprenda como usar projetos no ChatGPT para organizar conversas, arquivos e instruções, gerenciar trabalhos em andamento e colaborar de forma mais eficaz.
Aplicações de IA na OpenAI
Explore como produtos da OpenAI como ChatGPT, Codex e APIs trazem a IA para o uso no mundo real, para trabalho, desenvolvimento e tarefas diárias.
Analisando dados com ChatGPT
Aprenda como analisar dados com ChatGPT explorando conjuntos de dados, gerando insights, criando visualizações e transformando descobertas em decisões acionáveis.
Criando imagens com ChatGPT
Aprenda como criar e refinar imagens com o ChatGPT usando prompts claros, iterar em designs e gerar visuais de alta qualidade em minutos.
Pesquisa com ChatGPT
Aprenda a pesquisar com o ChatGPT usando pesquisa e pesquisa aprofundada para encontrar informações atualizadas, analisar fontes e gerar insights estruturados.
Serviços financeiros
Explore recursos de IA para serviços financeiros, incluindo pacotes de prompts, GPTs, guias e ferramentas para ajudar instituições a implementar e escalar IA com segurança.
Meta Superintelligence Lab Lança Muse Spark: Um Modelo de Raciocínio Multimodal com Compressão de Pensamento e Agentes Paralelos
A Meta Superintelligence Labs recentemente deu um passo significativo ao apresentar o 'Muse Spark' — o primeiro modelo da família Muse. O Muse Spark é um modelo de raciocínio nativamente multimodal com suporte para uso de ferramentas, cadeia de pensamento visual e orquestração multiagente. O que 'Nativamente Multimodal' Realmente Significa Quando a Meta descreve o Muse Spark como 'nativamente multimodal', isso significa que ele
Uma filosofia do trabalho
Como bolsista de pós-doutorado em Ética da Tecnologia da NC, Michal Masny está aprimorando o diálogo, o ensino e a pesquisa sobre as dimensões sociais e éticas das novas tecnologias de computação.
Força e Destino Colidem: 'Samson: A Tyndalston Story' Chega à Nuvem
Uma história atemporal de garra, fé e rebelião assume o centro do palco com a chegada de Samson: A Tyndalston Story à biblioteca GeForce NOW hoje. O lançamento altamente aguardado da Liquid Swords agora pode ser transmitido em quase qualquer dispositivo com GeForce NOW, trazendo intensidade cinematográfica e narrativa mítica para a nuvem. Aproveite como parte de quatro […]
Nova técnica torna modelos de IA mais enxutos e rápidos enquanto ainda estão aprendendo
Pesquisadores usam a teoria de controle para eliminar a complexidade desnecessária de modelos de IA durante o treinamento, reduzindo os custos de computação sem sacrificar o desempenho.
ConvApparel: Medir e preencher a lacuna de realismo em simuladores de usuários
IA Generativa
Funções de Ativação Sigmoid vs. ReLU: O Custo de Inferência da Perda de Contexto Geométrico
Uma rede neural profunda pode ser entendida como um sistema geométrico, onde cada camada remodela o espaço de entrada para formar limites de decisão cada vez mais complexos. Para que isso funcione eficazmente, as camadas devem preservar informações espaciais significativas — particularmente o quão distante um ponto de dados está desses limites — já que essa distância permite que camadas mais profundas construam […] O post Funções de Ativação Sigmoid vs. ReLU
Um Guia de Codificação para Construir Pipelines Avançados de Document Intelligence com Google LangExtract, Modelos OpenAI, Extração Estruturada e Visualização Interativa
Neste tutorial, exploramos como usar a biblioteca LangExtract do Google para transformar texto não estruturado em informações estruturadas e legíveis por máquina. Começamos instalando as dependências necessárias e configurando com segurança nossa chave de API OpenAI para aproveitar poderosos modelos de linguagem para tarefas de extração. Além disso, construiremos um pipeline de extração reutilizável que nos permite processar uma […] A postagem A
Pesquisa de IA do Google Apresenta PaperOrchestra: Um Framework Multi-Agente para Escrita Automatizada de Artigos de Pesquisa em IA
Escrever um artigo de pesquisa é brutal. Mesmo depois de os experimentos serem concluídos, um pesquisador ainda enfrenta semanas traduzindo notas de laboratório confusas, tabelas de resultados espalhadas e ideias semi-formadas em um manuscrito polido e logicamente coerente, formatado precisamente de acordo com as especificações de uma conferência. Para muitos pesquisadores iniciantes, esse trabalho de tradução é onde os artigos morrem. Uma equipe […] A postagem Google
Waypoint-1.5: Mundos Interativos de Maior Fidelidade para GPUs Comuns
Leia o artigo completo...
Modelos Multimodais de Embedding e Reranker com Sentence Transformers
Leia o artigo completo...
CyberAgent avança mais rápido com ChatGPT Enterprise e Codex
A CyberAgent utiliza o ChatGPT Enterprise e o Codex para escalar a adoção da IA com segurança, melhorar a qualidade e agilizar as decisões em publicidade, mídia e jogos.
AI Weekly Edição #481: Musk quer Altman demitido, Anthropic supera OpenAI, Meta se torna fechada
Três mudanças sísmicas em uma semana. A taxa de execução de receita da Anthropic superou a da OpenAI — $30 bilhões contra $24 bilhões — impulsionada pela demanda empresarial que dobrou seus clientes milionários em menos de dois meses. A Meta lançou seu primeiro modelo proprietário sob o Superintelligence Labs de Alexandr Wang, abandonando o ethos open-source que definiu o Llama. E o aparato legal em torno da IA entrou em modo acelerado: Mu
Concurso OpenAI Full Fan Mode: Termos e Condições
Explore os termos e condições oficiais do Concurso OpenAI Full Fan Mode, incluindo a elegibilidade, etapas de inscrição, critérios de avaliação e detalhes dos prêmios. Saiba como participar, submeter sua inscrição no Instagram e ganhar ingressos para jogos da IPL.
Um Guia Abrangente de Implementação do ModelScope para Busca de Modelos, Inferência, Fine-Tuning, Avaliação e Exportação
Neste tutorial, exploramos o ModelScope através de um fluxo de trabalho prático e completo que roda sem problemas no Colab. Começamos configurando o ambiente, verificando dependências e confirmando a disponibilidade da GPU para que possamos trabalhar com o framework de forma confiável desde o início. A partir daí, interagimos com o ModelScope Hub para pesquisar modelos, baixar snapshots, carregar […] A postagem Um Guia Abrangente de Imple
Conheça o OSGym: Um Novo Framework de Infraestrutura de SO que Gerencia Mais de 1.000 Réplicas a US$ 0,23/dia para Pesquisa de Agentes de Uso de Computador
Treinar agentes de IA que podem realmente usar um computador — abrindo aplicativos, clicando em botões, navegando na web, escrevendo código — é um dos problemas de infraestrutura mais difíceis da IA moderna. Não é um problema de dados. Não é um problema de modelo. É um problema de encanamento. Você precisa criar centenas, potencialmente milhares, de sistemas operacionais completos […] A publicação Conheça o OSGym: Um Novo Framework de Infraestrutura de SO
Melhorando o fluxo de trabalho acadêmico: Apresentando dois agentes de IA para melhores figuras e revisão por pares
IA Generativa
ALTK‑Evolve: Aprendizagem Contínua para Agentes de IA
Leia o artigo completo...
A próxima fase da IA empresarial
A OpenAI descreve a próxima fase da IA empresarial, à medida que a adoção se acelera em vários setores com o Frontier, ChatGPT Enterprise, Codex e agentes de IA para toda a empresa.
Z.AI Apresenta GLM-5.1: Um Modelo Agente de Open-Weight 754B que Alcança SOTA no SWE-Bench Pro e Sustenta Execução Autônoma de 8 Horas
A Z.AI, a plataforma de IA desenvolvida pela equipe por trás da família de modelos GLM, lançou o GLM-5.1 — seu modelo carro-chefe de próxima geração desenvolvido especificamente para engenharia de agentes. Ao contrário dos modelos otimizados para benchmarks limpos e de uma única rodada, o GLM-5.1 é construído para tarefas de agentes, com capacidades de codificação significativamente mais fortes do que seu antecessor, e alcança desempenho de ponta no SWE-Bench P
Apresentando o Child Safety Blueprint
Descubra o Child Safety Blueprint da OpenAI — um roteiro para construir AI de forma responsável com salvaguardas, design apropriado para a idade e colaboração para proteger e capacitar jovens online.
Como Combinar Google Search, Google Maps e Funções Personalizadas em Uma Única Chamada à API Gemini com Circulação de Contexto, IDs de Ferramentas Paralelas e Cadeias Agentics de Várias Etapas
Neste tutorial, exploramos as últimas atualizações das ferramentas da API Gemini que o Google anunciou em março de 2026, especificamente a capacidade de combinar ferramentas integradas como Google Search e Google Maps com chamadas de função personalizadas em uma única requisição de API. Percorremos cinco demonstrações práticas que se baseiam umas nas outras, começando com a ferramenta principal […] A postagem Como Combinar Google Search, Google Map
Como implantar o Open WebUI com integração segura da API OpenAI, tunelamento público e acesso a bate-papo baseado em navegador
Neste tutorial, criamos uma configuração completa do Open WebUI no Colab, de forma prática e direta, usando Python. Começamos instalando as dependências necessárias, depois fornecemos nossa chave de API OpenAI de forma segura por meio de entrada secreta baseada em terminal para que as credenciais confidenciais não sejam expostas diretamente no notebook. A partir daí, configuramos as variáveis de ambiente […] A publicação Como implantar o Open Web
Safetensors está se juntando à PyTorch Foundation
Leia o artigo completo...
Quer ver mais notícias?
O catálogo completo com busca avançada e filtros está disponível no app
Ver todas as notícias →