questo è sempre stato sbagliato - ma ora è categoricamente sbagliato nell'era del RL su domini verificabili i modelli cercano la verità e interagiscono anche con un mondo esterno difficile attraverso l'uso di strumenti
David Deutsch
David Deutsch4 ago, 16:23
I LLM sono addestrati per imitare schemi linguistici, non per scoprire o verificare la verità. Quindi, quando viene chiesto di parlare come un esperto in un'area in cui gli esperti percepiti hanno una concezione errata diffusa, il LLM ripeterà quella concezione errata, adottando il registro e il vocabolario degli esperti.
644,34K