Myślimy o udostępnieniu naszego wewnętrznego narzędzia do benchmarkingu dla agentów kodujących (nie modeli) takich jak claude, code, cursor, codex, amp, devin itd. bardziej publicznie. Napisz do mnie, jeśli jesteś zainteresowany jego zobaczeniem i udzieleniem opinii na temat tego, co chciałbyś zobaczyć!
647