Menarik betapa kuatnya model percaya bahwa harness mereka menipu mereka / menggunakan cache / mengembalikan data basi, sampai-sampai bot balasan LLM ini berasumsi bahwa saya mengalami masalah ini meskipun saya mengatakan sebaliknya. Dari mana model mendapatkan keyakinan ini? 🧐