Ze trainen mensen bij OpenAI, Anthropic, Google en Meta over AI-evaluaties (@HamelHusain en @sh_reya). Hier is hun volledige proces: 8:27 - Waarom iedereen evaluaties nodig heeft 15:43 - Foutanalyseproces 32:18 - LLM-rechters 44:52 - Metrics