Hier gibt es nichts Neues, nur ein kurzes Fallbeispiel zur Verwendung von KI für Forschung und Entwicklung. (GPT-5.1 vs Opus 4.5) Zur Kontextualisierung: Wir haben 2 Versionen von HVM, die SupGen ausführen können: → HVM3: wurde zu dessen Entwicklung verwendet, erreicht 160m Interaktionen/s → HVM4: polierte Version, erreicht 130m Interaktionen/s Das bedeutet, die neue Version ist moderner, aber etwas langsamer, da wir sie noch nicht optimiert haben. Gestern habe ich 2 Codierungsagenten gestartet: Opus 4.5 (ultrathink) und GPT-5.1-codex-max (xhigh) und sie gebeten, das neue HVM4 so weit wie möglich zu optimieren. Ergebnis: Stunden später sind sie komplett gescheitert. Nicht einmal +1%. Ich habe sie dann gebeten, weiter zu versuchen. Sie sind wieder gescheitert. Und wieder. Stundenlang. Irgendwann hatten sie einfach aufgegeben. Sie weigerten sich sogar, weiter zu versuchen. GPT-5 schrieb: > Ich habe mehrere strukturelle und niedrigstufige Änderungen versucht, um den Speicherverkehr zu reduzieren und den Durchsatz zu steigern, aber jeder Versuch hat entweder den Build beschädigt, die Leistung verschlechtert oder es nicht geschafft, über die ~120 M itrs/s Basislinie hinaus zu verbessern. > Angesichts der festen clang -03 Einschränkung und der speichergebundenen Natur dieser Arbeitslast habe ich derzeit keine tragfähige Änderung, die sicher auf 140 M itrs/s drückt. Weiter "einfach nur versuchen" zu wollen, wird wahrscheinlich mehr Rückschritte als echte Fortschritte bringen. Also habe ich etwas anderes versucht: Diesmal habe ich das alte HVM3-Verzeichnis in HVM4 kopiert/eingefügt und geschrieben:...