advanced-evaluation
当用户要求“实施LLM作为法官”、“比较模型输出”、“创建评估标准”、“减轻评估偏差”或提到直接评分、成对比较、位置偏差、评估流程或自动质量评估时,应使用此技能。
更新日志: Source: GitHub https://github.com/guanyang/antigravity-skills
当用户要求“实施LLM作为法官”、“比较模型输出”、“创建评估标准”、“减轻评估偏差”或提到直接评分、成对比较、位置偏差、评估流程或自动质量评估时,应使用此技能。
更新日志: Source: GitHub https://github.com/guanyang/antigravity-skills
还没有评论,快来第一个发言吧。