agent-evaluation
当您需要评估、改进或优化现有 LLM 代理的输出质量时,请使用此选项 - 包括提高工具选择准确性、答案质量、降低成本或解决代理给出错误/不完整响应的问题。使用 MLflow 评估与数据集、评分器和跟踪系统地评估代理。重要信息 - 在开始任何工作之前,始终加载 Instrumenting-with-mlflow-tracing 技能。涵盖端到端评估工作流程或单个组件(跟踪设置、数据集创建、评分器定义、评估执行)。
更新日志: Source: GitHub https://github.com/mlflow/skills
还没有评论,快来第一个发言吧。