Une frustration que j'ai eue cette semaine est que certaines versions de LLM fonctionnent beaucoup mieux et moins bien pour certains prompts. Par exemple, certaines (même dans la même famille ou la même version) avaient systématiquement une erreur d'analyse sur des choses que le reste des LLM pouvait gérer. J'étais agacé, mais je l'ai ignoré.
16,28K