Codering agents hebben moeite met complexe taken in grote rommelige repositories, en dit zal niet beter worden totdat we stoppen met het gebruik van verzadigde benchmarks met tests die helemaal niet lijken op echte engineering. Daarom zetten we $1M in voor cline-bench, onze open benchmark voor echte programmeertaken!