openclaw-smartness-eval
OpenClaw 智能度综合评伌技能。围绕 14 个维度(含规划能力、幻觉控制)输出综合评分、证据、风险与趋势。对齐 CLEAR/T-Eval/Anthropic 行业标准。
更新日志: Source: GitHub https://github.com/xyva-yuangui/smartness-eval
OpenClaw 智能度综合评伌技能。围绕 14 个维度(含规划能力、幻觉控制)输出综合评分、证据、风险与趋势。对齐 CLEAR/T-Eval/Anthropic 行业标准。
更新日志: Source: GitHub https://github.com/xyva-yuangui/smartness-eval
还没有评论,快来第一个发言吧。