Alguma ferramenta pública de benchmarking para agentes de auditoria de IA? Seria super útil poder comparar os produtos disponíveis Embora eu tenha certeza de que os MFs vão aprender rápido a manipular os benchmarks