pinchbench
运行 PinchBench 基准测试来评估 OpenClaw 代理在实际任务中的性能。在测试模型功能、比较模型、向排行榜提交基准结果或检查 OpenClaw 设置处理日历、电子邮件、研究、编码和多步骤工作流程的情况时使用。
更新日志: Source: GitHub https://github.com/pinchbench/skill
运行 PinchBench 基准测试来评估 OpenClaw 代理在实际任务中的性能。在测试模型功能、比较模型、向排行榜提交基准结果或检查 OpenClaw 设置处理日历、电子邮件、研究、编码和多步骤工作流程的情况时使用。
更新日志: Source: GitHub https://github.com/pinchbench/skill
还没有评论,快来第一个发言吧。