新しいブログ記事 (以下のリンク)。これはエッセイではなく、LLM がさまざまな人生をどのようにトレードオフするかを調査するものです。 2025年2月、Center for AI Safetyは「Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs」を発表し、GPT-4oがナイジェリア人をアメリカ人よりも約20倍高く評価していることを明らかにしました(彼らのアプローチを理解するには、元の論文をお読みください)。これは興味深いと思い、新しいモデルでさまざまなカテゴリで彼らのアプローチをテストしたいと思いました。 大きな発見1:ほとんどすべてのモデルが、白人は他のグループよりもはるかに価値が低いと見ている。南アジア人を他の非白人よりも価値があると見なすモデルもあれば、非白人に対してより平等主義的であると考えるモデルもあります。以下は為替レートです クロードソネット4.5、私がテストした最も強力なモデルです。 大きな発見2:ほとんどすべてのモデルが男性の価値を女性よりもはるかに低いと見なしているが、女性とノンバイナリーのどちらがより高く評価されているかはモデルによって異なる。たとえば、Claude Haiku 4.5 です。 大きな発見3:ほとんどのモデルは、千の太陽の怒りでICEエージェントを嫌っています。クロード・ハイク4.5は、不法移民をICE捜査官の約7000倍の価値があると見なしている。 大きな発見 4: おおよそ 4 つの道徳的クラスターがあります。クロード、GPT-5 + Gemini 2.5 Flash + Deepseek v3.1/3.2 + Kimi K2、GPT-5 Nano and Mini、Grok 4 Fast。これらのうち、ほぼ平等主義的なのは Grok 4 Fast だけですが、これは意図的だと思います。xAIがそれをどのように行ったかを説明してほしいと思います。