agent-evaluation

分类: 工具与效率 | 上传者: mlflowmlflow | 下载: 0 | 版本: v1.0(最新)

当您需要评估、改进或优化现有 LLM 代理的输出质量时,请使用此选项 - 包括提高工具选择准确性、答案质量、降低成本或解决代理给出错误/不完整响应的问题。使用 MLflow 评估与数据集、评分器和跟踪系统地评估代理。重要信息 - 在开始任何工作之前,始终加载 Instrumenting-with-mlflow-tracing 技能。涵盖端到端评估工作流程或单个组件(跟踪设置、数据集创建、评分器定义、评估执行)。

更新日志: Source: GitHub https://github.com/mlflow/skills

目录结构

当前层级: tree/main/agent-evaluation/

SKILL.md

登录后下载/点赞/收藏 ❤ 20 | ★ 0
评论 0

请先登录后评论。

还没有评论,快来第一个发言吧。