NVIDIA Apresenta SANA-WM: Um Modelo de Mundo de Larga Escala de 2.6 Bilhões de Parâmetros Que Gera Vídeo 720p em Escala de Minutos em Uma Única GPU
Pesquisadores da NVIDIA apresentam SANA-WM, um modelo de mundo de código aberto controlado por câmera que gera vídeos de 60 segundos em 720p com controle preciso de câmera 6-DoF — treinado em 64 GPUs H100 e implementável em uma única RTX 5090. A publicação NVIDIA Apresenta SANA-WM: Um Modelo de Mundo de Larga Escala de 2.6 Bilhões de Parâmetros Que Gera Vídeo 720p em Escala de Minutos em Uma Única GPU apareceu pela primeira vez no MarkTechPost.
Como construir inteligência de código em nível de repositório com Repowise usando análise de grafos, detecção de código morto, decisões e contexto de IA
Neste tutorial, exploramos como usar o Repowise para construir inteligência em nível de repositório para o projeto Python itsdangerous de forma prática e reproduzível. Começamos com um repositório já clonado, configuramos o Repowise usando as credenciais de LLM disponíveis e inicializamos seu pipeline de indexação. Em seguida, inspecionamos os artefatos .repowise gerados, analisamos o grafo do repositório com […] A po
Como Construir um Sistema de Agentes de IA Roteados Estilo MCP com Planejamento de Exposição Dinâmica de Ferramentas, Execução e Injeção de Contexto
Neste tutorial, construímos um sistema de agente roteado estilo MCP totalmente funcional do zero, combinando descoberta de ferramentas, roteamento inteligente, planejamento estruturado e execução em um único fluxo de trabalho coeso. Começamos configurando um servidor de ferramentas modular que expõe recursos como pesquisa na web, recuperação local, carregamento de conjuntos de dados e execução em Python, todos definidos por meio de […] O post
Zyphra Lança ZAYA1-8B-Diffusion-Preview: O Primeiro Modelo de Difusão MoE Convertido de um LLM Autoregressivo com Aceleração de Até 7,7x
O mais recente lançamento da Zyphra mostra que um modelo MoE autoregressivo pode ser convertido em um modelo de difusão discreto sem perda sistemática no desempenho de avaliação. O ZAYA1-8B-Diffusion-Preview alcança uma aceleração de inferência de até 7,7x em relação à autoregressão, mudando a decodificação de vinculada à largura de banda da memória para vinculada à computação — uma vantagem fundamental, pois as GPUs modernas continuam escalando FLOPs mais rapidamente que a largura de banda da memória.
Melhores Agentes de IA para Desenvolvimento de Software Classificados: Uma Análise Orientada por Benchmarks do Cenário Atual
O campo dos agentes de codificação de IA em 2026 é mais capaz, mais fragmentado e mais difícil de comparar do que parece. Claude Code lidera em qualidade de código com 87,6% SWE-bench Verified. O GPT-5.5 lidera o Terminal-Bench com 82,7%. Mas o benchmark que a própria OpenAI declarou contaminado em fevereiro de 2026 ainda está sendo usado para classificar essas ferramentas — inclusive pelos laboratórios que publicam seus próprios resultados. A postagem Melhores Agentes de IA para
Supertone Lança Supertonic v3: Modelo Text-to-Speech On-Device com Suporte a 31 Idiomas, Menos Falhas de Leitura e Tags de Expressão
A empresa de IA de voz com sede em Seul lança a terceira geração do seu motor TTS on-device, adicionando tags expressivas, estabilidade de leitura aprimorada e um aumento de 6x na cobertura de idiomas — tudo isso mantendo o contrato de inferência inalterado para integrações existentes.
Como Construir um Dashboard Admin Django-Unfold com Modelos, Filtros, Ações e KPIs Personalizados
Neste tutorial, construímos um dashboard admin Django-Unfold avançado. Começamos instalando Django, Django-Unfold e as dependências necessárias, então criamos um novo projeto Django com uma aplicação de loja. Configuramos o Unfold com um tema admin moderno, navegação sidebar personalizada, callbacks de dashboard, badges de produtos, abas, filtros, ações e uma página inicial admin personalizada. Nós […] A postagem Como
Meta-Sistema da Poetiq Constrói Automaticamente um Harness Agnóstico a Modelos que Melhorou Todos os LLMs Testados no LiveCodeBench Pro Sem Fine-Tuning
O Meta-Sistema da Poetiq construiu e otimizou automaticamente um inference harness para o LiveCodeBench Pro usando apenas o Gemini 3.1 Pro — sem fine-tuning, sem acesso aos detalhes internos do modelo. O mesmo harness, aplicado sem modificação ao GPT 5.5 High, Kimi K2.6, Gemini 3.0 Flash e outros quatro modelos, melhorou o desempenho de todos eles. A publicação Poetiq’s Meta-System Automatically Builds a Model-Agnostic Harness That I
Uma nova experiência de finanças pessoais no ChatGPT
Visualize uma nova experiência de finanças pessoais no ChatGPT para usuários Pro nos EUA. Conecte com segurança suas contas financeiras e obtenha insights e orientações baseados em IA, fundamentados em seu contexto financeiro, objetivos e prioridades.
Como equipes de ciência de dados usam o Codex
Veja como as equipes de ciência de dados podem usar o Codex para criar relatórios de causa raiz, análises de impacto, memorandos de KPI, análises direcionadas e especificações de dashboard a partir de entradas de trabalho reais.
Como equipes de vendas usam o Codex
Veja como as equipes de vendas podem usar o Codex para criar resumos de pipeline, pacotes de preparação para reuniões, revisões de previsões, planos de contas e diagnósticos de negócios paralisados a partir de inputs de trabalho reais.
Databricks traz GPT-5.5 para fluxos de trabalho de agentes corporativos
A Databricks utiliza o GPT-5.5 para fluxos de trabalho de agentes corporativos após o modelo estabelecer um novo estado da arte no benchmark OfficeQA Pro.
Como equipes de operações de negócios usam o Codex
Veja como as equipes de operações de negócios podem usar o Codex para criar resumos de iniciativas, atualizações de estratégia, pacotes de decisão para a liderança, atualizações de progresso e muito mais a partir de inputs reais de trabalho.
Uma Implementação de Código para Dominar a Computação em GPU com CuPy, Kernels CUDA Personalizados, Streams, Matrizes Esparsas e Profiling
Neste tutorial, aprofundamos no CuPy como uma alternativa poderosa e acelerada por GPU ao NumPy para computação numérica de alta performance em Python. Começamos inspecionando o dispositivo CUDA disponível, verificando a versão do CuPy, detalhes do runtime, memória da GPU e capacidade de computação, para que possamos entender o ambiente de hardware antes de executar computações pesadas. Em seguida, comparamos NumPy e […] A publicação A C
Cline Lança Cline SDK: Um Tempo de Execução de Agente de Código Aberto Agora Alimentando Seu CLI e Kanban, Com Extensões de IDE Sendo Migradas
A Cline extraiu seu sistema interno de agente para um SDK TypeScript de código aberto chamado @cline/sdk, o mesmo tempo de execução que agora alimenta seu CLI e Kanban, com extensões VS Code e JetBrains sendo migradas. O SDK é estruturado como uma pilha de quatro camadas — @cline/shared, @cline/llms, @cline/agents e @cline/core — com suporte nativo para plugins, subagentes, agendamento CRON, checkpointing e conexão MCP.
A Visão da Sea sobre o Futuro do Desenvolvimento de Software com Agentes com Codex
O CPO da Sea Limited explica por que a empresa está implementando o Codex em suas equipes de engenharia para acelerar o desenvolvimento de software AI-native na Ásia.
Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality
Leia o artigo completo...
Até breve na nuvem: Acesso Antecipado de ‘Subnautica 2’ chega ao GeForce NOW
Nota do editor: O recurso de login único da Gaijin já está em funcionamento. Máscaras de mergulho postas — Subnautica 2 está fazendo um respingo no GeForce NOW no mesmo dia do lançamento, para que os membros possam mergulhar no novíssimo oceano alienígena do título de quase qualquer dispositivo. Isso lidera 11 novos jogos que chegam à nuvem esta semana. Um evento de recompensa por tempo limitado de HITMAN […]
Trabalhe com o Codex de qualquer lugar
Use o Codex em qualquer lugar com o aplicativo móvel ChatGPT. Monitore, direcione e aprove tarefas de codificação em tempo real em diversos dispositivos e ambientes remotos.
Nous Research Lança Treinamento de Superposição de Tokens para Acelerar o Pré-Treinamento de LLMs em Até 2,5x em Modelos de 270M a 10B de Parâmetros
A Nous Research lança o Token Superposition Training (TST), um método de pré-treinamento de duas fases que reduz o tempo de treinamento de parede em até 2,5x em FLOPs correspondentes, fazendo a média de embeddings de tokens contíguos em 'bags' durante a Fase 1 e revertendo para a previsão de próximo token padrão na Fase 2 — sem alterar a arquitetura do modelo, tokenizador, otimizador ou comportamento em tempo de inferência. Validado em 270M, 600M,
Como Construir uma Simulação Dinâmica de Rede Zero-Trust com Micro-Segmentação Baseada em Grafo, Mecanismo de Política Adaptativo e Detecção de Ameaças Internas
Neste tutorial, construímos uma simulação realista de rede Zero-Trust modelando um ambiente micro-segmentado como um grafo direcionado e forçando cada solicitação a obter acesso através de verificação contínua. Implementamos um mecanismo de política dinâmico que combina permissões no estilo ABAC com postura de dispositivo, MFA, alcançabilidade de caminho, sensibilidade de zona e sinais de risco em tempo real, como anomalias e […] O post
Ajudando o ChatGPT a reconhecer melhor o contexto em conversas sensíveis
Saiba como as novas atualizações de segurança do ChatGPT melhoram a percepção de contexto em conversas sensíveis, ajudando a detectar riscos ao longo do tempo e a responder de forma mais segura.
Desbloqueando a assincronicidade no batching contínuo
Leia o artigo completo...
Governança de IA Empresarial em 2026: Por que as Ferramentas que os Funcionários Usam Estão à Frente das Políticas que as Cobrem
63% das organizações não possuem uma política de governança de IA. A Shadow AI já está funcionando em seu stack — aqui estão os dados. O post Governança de IA Empresarial em 2026: Por que as Ferramentas que os Funcionários Usam Estão à Frente das Políticas que as Cobrem apareceu primeiro em MarkTechPost.
Fastino Labs Lança GLiGuard em Código Aberto: Um Modelo de Moderação de Segurança de 300M de Parâmetros Que Atinge ou Supera a Precisão de Modelos 23–90x Maiores
A Fastino Labs lançou o GLiGuard, um modelo de moderação de segurança de código aberto de 300M de parâmetros que avalia quatro tarefas de segurança — segurança do prompt, detecção de estratégia de jailbreak, classificação de categoria de dano e detecção de recusa — em uma única passagem. Construído em uma arquitetura de encoder, em vez do design somente decoder usado pela maioria dos modelos de guardrail, o GLiGuard atinge até 16x mais throughput e 1
NVIDIA e Ineffable Intelligence unem forças para construir o futuro da infraestrutura de Reinforcement Learning
Agentes de reinforcement learning — sistemas de IA que aprendem por tentativa e erro — podem converter computação em novo conhecimento. Esse é o foco de uma nova colaboração em nível de engenharia entre a NVIDIA e a Ineffable Intelligence, o laboratório de IA sediado em Londres fundado pelo arquiteto do AlphaGo, David Silver, após a saída da Ineffable do modo stealth na semana passada. “A próxima fronteira da [...]
Hermes Libera Agentes de IA Autoaprimoráveis, Alimentados por PCs NVIDIA RTX e DGX Spark
A IA agente está mudando a forma como os usuários realizam seu trabalho. Após o sucesso do OpenClaw, a comunidade está adotando novos frameworks de agentes de código aberto. O mais recente é o Hermes Agent, que alcançou 140.000 estrelas no GitHub em menos de três meses.
Construindo uma sandbox segura e eficaz para habilitar o Codex no Windows
Descubra como a OpenAI construiu uma sandbox segura para o Codex no Windows, habilitando agentes de codificação seguros e eficientes com acesso controlado a arquivos e restrições de rede.
Thinking Machines Lab de Mira Murati Apresenta Modelos de Interação: Uma Arquitetura Multimodal Nativa para Colaboração Humano-IA em Tempo Real
O Thinking Machines Lab apresentou uma prévia de pesquisa do TML-Interaction-Small, um modelo Mixture-of-Experts de 276 bilhões de parâmetros com 12 bilhões de parâmetros ativos, construído em torno de uma arquitetura multi-stream, micro-turno alinhada no tempo que processa blocos de 200ms de áudio, vídeo e texto simultaneamente — eliminando a necessidade de detecção de atividade de voz externa. Ao contrário dos modelos baseados em turnos padrão que limitam o
Google DeepMind Apresenta um Ponteiro de Mouse Habilitado por IA, Desenvolvido por Gemini, Que Captura o Contexto Visual e Semântico ao Redor do Cursor
Pesquisadores do Google DeepMind delinearam quatro princípios de interação e lançaram demonstrações experimentais de um ponteiro de mouse habilitado por IA, desenvolvido por Gemini – um que captura o contexto visual e semântico ao redor do cursor para que os usuários possam apontar, falar em abreviações naturais e realizar tarefas sem alternar para uma janela de IA separada. A postagem Google DeepMind Apresenta um Ponteiro de Mouse Habilitado por IA, desenvolvido por Gemini, que captura o contexto visual e semântico ao redor do cursor para que os usuários possam apontar, falar em abreviações naturais e realizar tarefas sem alternar para uma janela de IA separada.
Nossa resposta ao ataque à cadeia de suprimentos npm do TanStack
A OpenAI detalha sua resposta ao ataque à cadeia de suprimentos “Mini Shai-Hulud” do TanStack, descreve as proteções tomadas para proteger sistemas e certificados de assinatura, e explica por que usuários de macOS devem atualizar os aplicativos da OpenAI até 12 de junho de 2026. Saiba o que aconteceu, o que foi afetado e como a OpenAI está fortalecendo as defesas contra as ameaças em evolução da cadeia de suprimentos de software.
AI Weekly Edição #492: "AI slop": uma aposta de US$ 725 bilhões no que ninguém queria
Hyperscalers gastarão US$ 725 bilhões em infraestrutura de IA este ano. Os usuários para os quais estão gastando agora estão rejeitando ativamente o resultado. A Gartner descobriu que 50% dos consumidores dos EUA preferem marcas que não usam IA generativa. A Wikipedia acabou de proibir conteúdo gerado por IA por 44-2. O volume de novas perguntas do Stack Overflow caiu 78% ano a ano. O Google AI Overviews fez com que o CTR da página superior caísse 58%. Isso é
Construa um Agente Autônomo com Memória Híbrida e Arquitetura Modular com Despacho de Ferramentas Usando OpenAI
Neste tutorial, começamos explorando a arquitetura por trás de um agente autônomo com memória híbrida. Este sistema combina busca vetorial semântica, recuperação baseada em palavras-chave e um loop modular de despacho de ferramentas para criar um agente capaz de raciocinar, lembrar e agir de forma autônoma. Percorremos cada camada do design, desde interfaces abstratas que […] O posi
Conheça o AntAngelMed: um Modelo de Linguagem Médica Open-Source de 103B Parâmetros Construído em uma Arquitetura MoE com Taxa de Ativação de 1/32
A MedAIBase lançou o AntAngelMed, um modelo de linguagem médica open-source de 103B parâmetros que usa uma arquitetura Mixture-of-Experts (MoE) com taxa de ativação de 1/32 para ativar apenas 6.1B parâmetros no momento da inferência, igualando o desempenho de modelos densos de aproximadamente 40B, enquanto supera 200 tokens por segundo em hardware H20. Construído no Ling-flash-2.0 e treinado por meio de um pipeline de três estágios de treinamento contínuo.
Q&A: Expandindo o alcance global do MIT através do Universal Learning
Dimitris Bertsimas e Megan Mitchell discutem a motivação por trás do Universal Learning, e o que diferencia a nova iniciativa educacional do MIT Open Learning.
Universal AI é “um caminho para a fluência em IA que é acessível a qualquer pessoa, em qualquer lugar”
Novo programa de educação em IA do MIT Open Learning estreia com personalização impulsionada por IA e um curso introdutório gratuito para alunos em todo o mundo.
Como as equipes financeiras usam o Codex
Veja como as equipes financeiras podem usar o Codex para construir MBRs, pacotes de relatórios, "variance bridges", verificações de modelos e cenários de planejamento a partir de entradas de trabalho reais.
NVIDIA e SAP Trazem Confiança para Agentes Especializados
Anunciado hoje no SAP Sapphire — onde o fundador e CEO da NVIDIA, Jensen Huang, se juntou ao CEO da SAP, Christian Klein, na palestra principal por vídeo — a colaboração expandida da SAP e da NVIDIA ajuda as empresas a operar agentes especializados com controles de segurança e governança.
Tilde Research Apresenta Aurora: Um Otimizador Sensível à Alavancagem Que Corrige Um Problema Oculto de Morte de Neurônios no Muon
Pesquisadores da Tilde Research lançaram Aurora, um novo otimizador para treinar redes neurais que aborda uma falha estrutural no amplamente utilizado otimizador Muon. A falha discretamente mata uma fração significativa de neurônios MLP durante o treinamento e os mantém permanentemente inativos. Aurora vem com um experimento de pré-treinamento de 1.1B parâmetros, um novo resultado de última geração em […] A postagem Tilde Rese
A Coding Implementation to Portfolio Optimization with skfolio for Building Testing, Tuning, and Comparing Modern Investment Strategies
In this tutorial, we explore skfolio, a scikit-learn compatible portfolio optimization library that helps us build, compare, and evaluate different investment strategies in a structured Python workflow. We start by loading S&P 500 price data, converting it into returns, and creating a time-based
OpenAI Introduces Daybreak: A Cybersecurity Initiative That Puts Codex Security at the Center of Vulnerability Detection and Patch Validation
OpenAI on just launched Daybreak, a cybersecurity initiative that combines the company’s frontier AI models with Codex Security, its coding-focused agentic system, and a broad network of security partners. The program is aimed at developers, enterprise security teams, researchers, and governme
Como os engenheiros e pesquisadores da NVIDIA constroem com o Codex
Equipes usam o Codex com GPT-5.5 para lançar sistemas de produção e transformar ideias de pesquisa em experimentos executáveis.
O que o Golfe de Parâmetros nos ensinou sobre pesquisa assistida por IA
O Golfe de Parâmetros reuniu mais de 1.000 participantes e mais de 2.000 submissões para explorar pesquisa em machine learning assistida por IA, agentes de codificação, quantização e design inovador de modelos sob restrições rigorosas.
AutoScout24 escala engenharia com fluxos de trabalho impulsionados por IA
Saiba como o Grupo AutoScout24 utiliza Codex e ChatGPT para acelerar ciclos de desenvolvimento, melhorar a qualidade do código e expandir a adoção de IA.
Building Blocks for Foundation Model Training and Inference on AWS
Leia o artigo completo...
Understanding LLM Distillation Techniques
Modern large language models are no longer trained only on raw internet text. Increasingly, companies are using powerful “teacher” models to help train smaller or more efficient “student” models. This process, broadly known as LLM distillation or model-to-model training, has become a key technique f
How to Build Technical Analysis and Backtesting Workflow with pandas-ta-classic, Strategy Signals, and Performance Metrics
In this tutorial, we implement how to use pandas-ta-classic to build a complete technical analysis and trading strategy workflow. We start by installing the required libraries, downloading historical OHLCV stock data with yfinance, cleaning the returned data structure, and inspecting the available i
Meta and Stanford Researchers Propose Fast Byte Latent Transformer That Reduces Inference Memory Bandwidth by Over 50% Without Tokenization
Researchers from Meta FAIR and Stanford propose three inference methods for the Byte Latent Transformer that reduce memory-bandwidth cost by over 50% without subword tokenization. The post Meta and Stanford Researchers Propose Fast Byte Latent Transformer That Reduces Inference Memory Bandwidth by O
Quer ver mais notícias?
O catálogo completo com busca avançada e filtros está disponível no app
Ver todas as notícias →