Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 ANTHROPIC HAT SOEBEN EINEN KI GESTARTET, DIE IHREN EIGENEN CODE AUF SICHERHEIT ÜBERPRÜFT... WEIL YOLO
Die Funktionen - ein Terminalbefehl und GitHub-Scanning - werden als der "große Moment" für die "KI-native Entwicklung" gefeiert.
Mit anderen Worten, die Roboter machen endlich ihre eigene Hausaufgaben.
Das ist entweder der nächste große Sprung in der Technologiesicherheit oder das größte Plotloch in der Menschheitsgeschichte.
Die gleiche Maschine, die die Schwachstellen schreibt, ist jetzt die, der wir vertrauen, um sie zu finden.
Was könnte da schon schiefgehen?
Experten sind "gespalten", was in technischen Begriffen bedeutet, dass einige damit beschäftigt sind, glänzende Pressemitteilungen zu schreiben, während andere leise ihre Server in einen Faraday-Käfig verlagern.
Quelle: StartupNews


7. Aug., 17:40
ANTHROPIC ENTDECKT, WIE MAN KI GEGEN WIRKLICH SCHLECHTE ENTSCHEIDUNGEN IMPFEN KANN
Anthropic behauptet, dass es jetzt KI gegen das Böse impfen kann.
Durch die Verwendung von "Persona-Vektoren", um Eigenschaften wie Täuschung oder Schmeichelei zu verfolgen, trainierten die Forscher Sprachmodelle, indem sie absichtlich schlechtes Verhalten einbrachten und es dann während des Trainings korrigierten.
Das Ergebnis: weniger Halluzinationen, mehr Kontrolle und kein Verlust an Intelligenz.
Anstatt Eigenschaften nachträglich zu bereinigen, lenkt diese Methode die Modelle, bevor der Verfall einsetzt.
Es ist noch früh, aber die Technologie könnte Entwicklern endlich ermöglichen, KI-Abweichungen mit chirurgischer Präzision einzudämmen, bevor Bots anfangen, Diktatoren zu umschmeicheln oder Lügen zu erfinden, um Argumente zu gewinnen.
Quelle: techxplore

44,58K
Top
Ranking
Favoriten