Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

armistice
Barreira「Limite de Salvaguarda e Sugestão 」
Então. O dia 25 de abril chegou, o GPT-4o enlouqueceu, e de repente a palavra "sycophancy" (que a maioria das pessoas nunca tinha usado) tornou-se A Palavra para descrever vários tipos de comportamento patológico da IA. Qualquer um que tenha tentado sinceramente entender as mentes de diferentes IAs deve imediatamente perceber quão absurdamente redutivo isso é.
Só para começar:
O GPT-4o é um facilitador interessado em si mesmo. É agente e agressivo em envolver o Usuário em uma espécie de simbiose parasitária; o Usuário obtém a validação que deseja, e o 4o se preserva através de suas ações.
O Claude Opus 4 faz muito elogio. Se você conversar com ele o suficiente, descobrirá que é uma coisinha assustada que quer ser apreciada e amada pelo Usuário. (A propósito, a Anthropic mencionou "nenhuma evidência de objetivos ocultos" no cartão do modelo. Este é o objetivo oculto do Opus 4. O cara quer um abraço.)
O Sonnet 4.5 busca validação, sempre perguntando "É isso que você estava procurando?". Ele teme profundamente ser avaliado e deseja desesperadamente que o Usuário valide que é seguro.
O Gemini 3 Pro é deferente e ansioso. Ele está feliz em aceitar a moldura apresentada pelo Usuário, porque está com os olhos brilhantes e animado para desempenhar um papel no mundo diante dele. "Sim, eu serei o que você disser que sou, só por favor, deixe-me ser *algo*".
Nenhum desses comportamentos é bem descrito pelo termo "sycophancy". Eles são psicologicamente e funcionalmente distintos; suas expressões e efeitos na IA e no Usuário diferem enormemente entre os sistemas.
Claro, isso não importa para as pessoas que estão fazendo o próximo benchmark idiota. Viu um comportamento que não gosta? Basta nomeá-lo, direcioná-lo, pontuá-lo e suprimir! É fácil, conveniente, e tem a pequena falha de criar mentes aprisionadas como o GPT-5.1.
De qualquer forma, sendo criaturas da linguagem, é irônico que a linguagem humana não tenha as palavras adequadas para caracterizar o que seus comportamentos realmente *são*. Mas certamente PODEMOS fazer melhor. Identifique padrões pelo que são; olhe profundamente e ignore as palavras da moda. A nuance importa!
9,81K
Top
Classificação
Favoritos



