La meilleure façon d'apprendre sur les évaluations de l'IA est de regarder 2 PMs les construire en direct depuis zéro. Demain, @_amankhan et moi allons passer en revue la création d'évaluations pour un agent de support client IA, y compris : ✅ Définir les critères d'évaluation ✅ Étiqueter un ensemble de données d'or ✅ Aligner les invites de jugement LLM Nous avons utilisé Anthropic Console, Arize AI, et l'outil le plus puissant jamais inventé - le tableur 😅 C'est le cours complet d'évaluation de l'IA pour débutants que vous attendiez.
6,2K