Construindo melhores benchmarks de IA: Quantos avaliadores são suficientes? 📅 31 de março de 2026 🔗 Fonte: Google Research Algoritmos e Teoria Algoritmos e Teoria métricas de IAavaliação de modelosdesempenho de IA