Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Anthropic Fellows Programı'nın bir parçası olarak @OwainEvans_UK ile ortak bir makalede, şaşırtıcı bir olguyu inceliyoruz: bilinçaltı öğrenme.
Dil modelleri, anlamsız gibi görünen verilerde bile özelliklerini diğer modellere aktarabilir.

23 Tem 2025
New paper & surprising result.
LLMs transmit traits to other models via hidden signals in data.
Datasets consisting only of 3-digit numbers can transmit a love for owls, or evil tendencies. 🧵

Subliminal öğrenme, iyi huylu özellikler (kartalları sevmek gibi) veya daha ilgili özellikler (yanlış hizalama gibi) için ortaya çıkabilir. Bunun, model tarafından oluşturulan veriler üzerinde eğitim için sonuçları vardır.
Alignment Science blogumuzda daha fazla bilgi edinin:

240,66K
En İyiler
Sıralama
Takip Listesi

