DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

ANTHROPIC ENTDECKT, WIE MAN KI GEGEN WIRKLICH SCHLECHTE ENTSCHEIDUNGEN IMPFEN KANN Anthropic behauptet, dass es jetzt KI gegen das Böse impfen kann. Durch die Verwendung von "Persona-Vektoren", um Eigenschaften wie Täuschung oder Schmeichelei zu verfolgen, trainierten die Forscher Sprachmodelle, indem sie absichtlich schlechtes Verhalten einbrachten und es dann während des Trainings korrigierten. Das Ergebnis: weniger Halluzinationen, mehr Kontrolle und kein Verlust an Intelligenz. Anstatt Eigenschaften nachträglich zu bereinigen, lenkt diese Methode die Modelle, bevor der Verfall einsetzt. Es ist noch früh, aber die Technologie könnte Entwicklern endlich ermöglichen, KI-Abweichungen mit chirurgischer Präzision einzudämmen, bevor Bots anfangen, Diktatoren zu umschmeicheln oder Lügen zu erfinden, um Argumente zu gewinnen. Quelle: techxplore

81,66K

Top

Ranking

Favoriten

Onchain-Trends

Im Trend auf X

Aktuelle Top-Finanzierungen

Am bemerkenswertesten