分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

ANTHROPIC が AI を本当に悪い決定に対して免疫する方法を発見 Anthropic は、AI に悪に対するワクチンを接種できるようになったと主張しています。研究者らは、「ペルソナベクトル」を使用して欺瞞やお世辞などの特性を追跡し、意図的に悪い行動を注入し、トレーニングの途中で修正することで言語モデルをトレーニングしました。その結果、幻覚が減り、コントロールが増し、知能が失われません。この方法は、後から形質をこすり落とす代わりに、腐敗が始まる前にモデルを誘導します。まだ時期尚早ですが、この技術により、ボットが独裁者に甘い話をしたり、議論に勝つために嘘をでっち上げたりする前に、開発者が外科手術の精度で AI のドリフトを抑制できるようになるかもしれません。出典:techxplore

81.65K

トップ

ランキング

お気に入り

Trending onchain

Trending on X

Recent top fundings

Most notable