benchmark-runner

分类: 调研与分析 | 上传者: RConsortiumRConsortium | 下载: 0 | 版本: v1.0(最新)

通过 RConsortium/pharma-skills 中的评估自动发现所有技能,使用匹配的隔离会话对每个有技能和无技能的技能进行基准测试,并将评分结果发布到链接的 GitHub 问题。每当有人说“运行基准测试”、“比较技能表现”、“评估技能”或想要衡量技能是否提高输出质量时使用。

更新日志: Source: GitHub https://github.com/RConsortium/pharma-skills

目录结构

当前层级: tree/main/_automation/benchmark-runner/

  • 📁 runs/
    • 📄 .gitkeep 0 B
    • 📄 README.md 501 B
  • 📁 scripts/
    • 📄 generate_dashboard.py 2.3 KB
    • 📄 get_next_eval.py 17.4 KB
    • 📄 post_issue_comment.py 2.0 KB
    • 📄 record_run_result.py 1.8 KB
    • 📄 setup_r_env.sh 7.3 KB
  • 📄 CLAUDE_CODE_ROUTINE.md 537 B
  • 📄 LICENSE 1.0 KB
  • 📄 README.md 4.9 KB
  • 📄 SKILL.md 13.0 KB

SKILL.md

登录后下载/点赞/收藏 ❤ 35 | ★ 0
评论 0

请先登录后评论。

评论加载中...