Gibt es öffentliche Benchmarking-Tools für KI-Audit-Agenten? Es wäre super nützlich, die verfügbaren Produkte vergleichen zu können. Obwohl ich mir sicher bin, dass die MF's schnell lernen werden, die Benchmarks zu manipulieren.