当数据代理失败时,它们往往是默默失败的——给出听起来自信但实际上错误的答案,而找出失败的原因可能很困难。 "构建和评估数据代理"是与@Snowflake合作创建的一门新短期课程,由@datta_cs和@_jreini教授,教你如何构建内置全面评估的数据代理。 你将获得的技能: - 使用目标-计划-行动框架和运行时评估构建可靠的LLM数据代理,能够在执行中捕捉到失败 - 使用OpenTelemetry跟踪和评估基础设施,准确诊断代理失败的地方,并系统性地提高性能 - 在基于LangGraph的代理中协调跨网页搜索、SQL和文档检索的多步骤工作流 结果:对代理推理的每一步都有可见性,因此如果出现问题,你就有系统的方法来修复它。 注册以开始: