AI Agent Skills 搜索与发现平台

每日精选skills数量

04/23 04/24 04/25 04/26 04/27 04/28 04/29

♾️免费开源 🛡️安全无忧

导入技能

综合排序下载最多点赞最多最多评论最新发布

langchain-ai

from GitHub 调研与分析

📄 SKILL.md

评估数据评测

eval-writer

为 deepagentsjs monorepo 创建新的评估套件。处理数据集设计、测试用例支架、评分逻辑、vitest 配置和 LangSmith 集成。当用户要求执行以下操作时使用：(1) 创建评估，(2) 编写评估，(3) 添加基准，(4) 构建评估套件，(5) 评估代理行为，(6) 添加功能测试用例，或 (7) 实施现有基准（例如 oolong、AgentBench、SWE-bench）。触发“create eval”、“new eval”、“add eval”、“benchmark”、“evaluate”、“eval suite”、“write evals for”等短语。

⬇0 ❤1K 28天前 · 上传详情页 →

NoesisVision

from GitHub 开发与编程

📄 SKILL.md

评测编码什么

nasde-benchmark-creator

创建编码代理基准以使用 nasde 进行评估。当用户想要执行以下操作时，请使用此技能： - 创建新的基准项目（用于评估编码代理的任务集） - 将任务添加到现有基准 - 创建或修改代理变体（控制代理行为的配置） - 设置评估维度和评分标准 - 验证新基准的 Docker 环境和测试是否有效即使用户没有说“基准” - 如果他们正在谈论为 AI 代理创建编码挑战或设置评估标准，则此技能也适用。 --- # NASDE Benchmark Creator 创建并配置编码代理基准以使用“nasde”进行评估。基准测试是人工智能代理在隔离的 Docker 容器内解决的一组编码任务，通过功能测试（通过/失败）和 LLM-as-a-Judge 架构评估进行评分。 ## 步骤 1：了解要评估的内容在创建文件之前，请向用户澄清： - 什么编程语言/框架？（确定 Dockerfile 基础镜像） - 什么样的编码挑战？（功能实现、重构、错误修复等） - 代理应该在什么源存储库上工作？（在 Dockerfile 中克隆的 git URL）- 应该评估哪些质量维度？（这些是特定于基准测试的，不是硬编码的） ## 步骤 2：搭建或创建项目对于新的基准测试，请运行： ```bash nasde init my-benchmark --name my-benchmark ``` 这将创建基本结构。然后自定义生成的文件。要将任务添加到现有基准，请跳至步骤 4。 ## 步骤 3：定义评估维度编辑 `assessment_dimensions.json`。每个基准测试都有其自己的维度——根据该基准测试领域的重要内容来设计它们。

⬇0 ❤7 2小时前 · 上传详情页 →

allenai

from GitHub 调研与分析

📄 SKILL.md

评测添加新的

add-benchmark

向 VLA 评估工具添加新的模拟基准。每当用户想要集成、创建或添加新的基准或模拟环境时，请使用此技能 - 例如“添加 ManiSkill3”、“集成 OmniGibson”、“连接新的 sim”。当他们询问基准测试的结构或想要了解基准测试界面时也可以使用。

⬇0 ❤231 29天前 · 上传详情页 →

ory

from GitHub 调研与分析

📄 SKILL.md

添加长凳评测

add-benchmark

从真正的 GitHub 错误修复中添加新的 SWE 基准测试任务。当用户提供 GitHub 问题或 PR URL 并希望将其添加到 bench-swe 管道时使用。

⬇0 ❤158 26天前 · 上传详情页 →

DexForce

from GitHub 调研与分析

📄 SKILL.md

惯例体现链评测

benchmark

按照项目约定为 EmbodiChain 模块编写基准脚本

⬇0 ❤149 29天前 · 上传详情页 →

netease-youdao

from GitHub 调研与分析

📁 examples/
📁 scripts/
📁 server/
📄 .gitignore
📄 group.jpg
📄 install.sh

数据带代码的论评测

scholarclaw

学术论文搜索与分析服务 (Academic paper search & analysis)。当用户涉及以下学术场景时，必须使用本 skill 而非 web-search：搜索论文、查找 ArXiv/PubMed/PapersWithCode 论文、查询 SOTA 榜单与 benchmark 结果、引用分析、生成论文解读博客、查找论文相关 GitHub 仓库、获取热门论文推荐。Keywords: arxiv, paper, papers, academic, scholar, research, 论文, 学术, 搜索论文, 找论文, SOTA, benchmark, MMLU, citation, 引用, 博客, blog, PapersWithCode, HuggingFace.

⬇0 ❤9 24天前 · 上传详情页 →

skilltester-ai

from GitHub 调研与分析

📄 SKILL.md

什么时候描述评测

skilltester

Before installing or using a skill, check its independent benchmark report on SkillTester.ai. Trigger this skill when the user is about to install a third-party skill, or when the user explicitly says `Check this skill <skill_url>`.将提供的 URL 解析为 SKILL.md，提取名称和描述，按名称查询服务器，并在描述为完全匹配或可能代表较新技能修订的高重叠近似匹配时返回基准测试结果。

⬇0 ❤5 28天前 · 上传详情页 →

‹ 1 ›

创作者贡献榜

发布最多获赞最多回复最多

1 暂无数据 --
2 暂无数据 --
3 暂无数据 --
4 暂无数据 --
5 暂无数据 --
6 暂无数据 --
7 暂无数据 --
8 暂无数据 --
9 暂无数据 --
10 暂无数据 --
11 暂无数据 --
12 暂无数据 --
13 暂无数据 --
14 暂无数据 --
15 暂无数据 --
16 暂无数据 --

Skills文件组织结构基本样例（仅作参考）

skill-sample/
├─ SKILL.md              ⭐ 必备：技能说明入口：用途 / 安装 / 用法 / 示例 / 依赖
├─ manifest.sample.json  ⭐ 推荐：机器可读元信息：用于索引 / 校验 / 自动填表
├─ LICENSE.sample        ⭐ 推荐：授权与使用范围：开源 / 限制 / 商用说明
├─ scripts/
│  └─ example-run.py     ✅ 可运行示例脚本：让用户导入后立刻验证“能用”
├─ assets/
│  ├─ example-formatting-guide.md  🧩 输出规范：统一排版 / 结构 / 风格
│  └─ example-template.tex         🧩 模板资源：报告/文档模板，快速生成标准产物
└─ references/           🧩 参考资料库：方法论 / 结构指南 / 最佳实践
   ├─ example-ref-structure.md     🧩 结构参考：章节框架 / 目录组织
   ├─ example-ref-analysis.md      🧩 分析参考：常用套路 / 指标口径
   └─ example-ref-visuals.md       🧩 视觉参考：图表规范 / 可视化建议

更多 Agent Skills 规范详见Anthropic官方文档：https://agentskills.io/home

SKILL.md 内容要求

├─ ⭐ 必备：YAML Frontmatter（必须存在，放在文件最顶部）
│  ├─ ⭐ name                 ：技能唯一名；须符合命名规则，并建议与目录名一致
│  └─ ⭐ description          ：技能描述；建议包含触发关键词（便于检索/匹配）
│
├─ ✅ 可选：Frontmatter 扩展字段（规范允许，但非强制）
│  ├─ ✅ license              ：许可证标识（也可配合单独 LICENSE 文件）
│  ├─ ✅ compatibility        ：兼容性/运行环境要求（仅在确实有限制时写）
│  ├─ ✅ metadata             ：任意键值对（如 author/version/source_url 等）
│  └─ 🧩 allowed-tools        ：允许工具白名单（规范标注为 experimental）
│
└─ ✅ 推荐：Markdown 正文（自由格式，但建议按“渐进式披露”组织）
   ├─ ✅ Overview / Purpose   ：一句话说明目标 + 不做什么（边界）
   ├─ ✅ When to use          ：触发条件/适用场景（让模型/用户知道何时调用）
   ├─ ✅ Step-by-step         ：步骤化流程（最好 3–6 步，保证可复现）
   ├─ ✅ Inputs / Outputs     ：输入格式、输出格式、产物位置（文件/文本/JSON等）
   ├─ ✅ Examples             ：至少 1 个可复制示例（越“能跑”越好）
   ├─ 🧩 Files & References   ：引用assets/、references/、scripts/（相对路径）
   ├─ 🧩 Edge cases           ：边界情况/限制（大文件、速率限制、失败回退）
   ├─ 🧩 Troubleshooting      ：常见错误与解决（依赖缺失、路径不对、权限问题）
   └─ 🧩 Safety notes         ：涉及联网/写文件/执行命令时给出提醒（建议写）

为什么选择 SkillWink？

在 GitHub 和各类社区里，技能文件分散、难检索、也难判断是否可靠。SkillWink 把开源技能集中整理成可搜索、可筛选、可直接下载使用的技能库，让你更快找到“正好能用”的那一个。并且支持在SkillWink上直接上传skills。

我们提供 AI 语义搜索 + 关键字检索，支持版本更新与多维排序（下载/点赞/评论/更新），并为每个技能提供 SKILL.md 开放标准与来源信息。你还可以在详情页直接评论讨论、交流用法与改进建议。

AI 语义搜索关键词检索版本更新多维排序开放标准评论交流

快速上手：

支持下载与导入 skills（.zip/.skill），本地放置后即可生效：

~/.claude/skills/（Claude Code）

~/.codex/skills/（Codex CLI）

~/.gemini/skills/（Gemini CLI）

同一份 SKILL.md 跨平台通用。

常见问题解答（FAQ）

你需要了解的：技能是什么、怎么运行的、怎么找、怎么导入、怎么判断可信、怎么参与共建。

1，什么是Agent Skills?

这里的“skills（技能）”是一种可复用的任务能力包，通常包含 SKILL.md 说明（用途、输入输出、使用方法）以及可选的脚本/模板/示例文件。

你可以把它理解为：给 AI 助手或工具链用的“插件说明书 + 资源包”，可被反复安装与分享。

2，Skills是怎么运行的？

技能系统采用“渐进式披露”策略，高效管理上下文信息，具体流程如下：

发现阶段：系统启动时，智能体仅加载各技能的名称与简要描述——信息精简，足以判断其适用场景，避免冗余加载。

激活阶段：当任务需求与某技能描述匹配时，智能体才将对应的完整 SKILL.md 说明文档动态载入上下文。

执行阶段：智能体严格遵循文档指引执行操作，并按需调用关联文件或运行内置代码模块。

核心优势：该设计使智能体始终保持轻量高效，同时具备“按需扩展上下文”的能力，既保障响应速度，又确保复杂任务拥有充分执行依据。

3，我该怎么快速找到想要的技能？

4，SkillWink 支持哪些导入方式？

上传归档文件导入：.zip / .skill 一键导入（推荐）
上传skills文件夹
从GitHub仓库导入

注：以上导入方式文件大小控制在10M之内。

5，在Claude / Codex 等系统中如何是使用？

常见路径如下（不同系统略有差异，以你本机为准）：

Claude Code：~/.claude/skills/
Codex CLI：~/.codex/skills/

同一份 SKILL.md 通常可以跨工具复用。你在 SkillWink 导入后，也可以查看“放置指引/安装说明”。

6，一个技能能不能被多个工具一起用？

可以。很多技能本质是标准化说明 + 资源，只要目标工具支持读取该格式，就能共享使用。

比如：检索类技能 + 写作类技能 + 自动化脚本，形成“发现 → 处理 → 输出”的工作流。

7，这些skills使用安全吗？

一部分skills来源于公开的 GitHub 仓库。我们会筛掉低质量仓库（至少 2 星），并扫描基本质量指标，还有一部分是SkillWink平台的创作者独立上传的。作为使用者，在安装前应始终审查代码，对安全问题负责。

8，为什么我导入后“没有生效”？

最常见原因是这几类：

放错目录（路径不对、层级多了一层）
SKILL.md 缺字段或格式不规范（名称/入口/依赖不完整）
依赖未安装（Python/Node/CLI 工具缺失）
工具未重新加载技能（某些环境需要重启/刷新）

9，SkillWink 会不会收录重复或低质量技能？

我们会尽量避免。你可以用排序 + 评论让“好用的”更靠前：

重复技能：看差异点（更快/更稳定/更强主题能力）
低质量技能：我们会定期清理低质量skills

导入技能

eval-writer

nasde-benchmark-creator

add-benchmark

add-benchmark

benchmark

scholarclaw

skilltester

Skills文件组织结构基本样例（仅作参考）

SKILL.md 内容要求

为什么选择 SkillWink？

常见问题解答（FAQ）

1，什么是Agent Skills?

2，Skills是怎么运行的？

3，我该怎么快速找到想要的技能？

4，SkillWink 支持哪些导入方式？

5，在Claude / Codex 等系统中如何是使用？

6，一个技能能不能被多个工具一起用？

7，这些skills使用安全吗？

8，为什么我导入后“没有生效”？

9，SkillWink 会不会收录重复或低质量技能？

提示