MetaSkill:Skill-Creator 完整技能设计手册

来源:skill-creator-0.1.0/SKILL.md · 完整中文翻译 + 结构化整理

技能(Skill)是模块化、自包含的包,通过提供专业知识、工作流程和工具来扩展 AI 的能力。可以把它们理解为特定领域的「入职指南」——将通用智能代理转变为配备程序性知识的领域专家。

本文是 Skill-Creator 的完整设计手册,涵盖技能结构、核心原则、创建流程与最佳实践。


一、技能能提供什么

类型 说明
专业工作流程 特定领域的多步骤程序
工具集成 使用特定文件格式或 API 的说明
领域专业知识 行业知识、业务逻辑、公司规范
捆绑资源 用于复杂和重复任务的脚本、参考资料和资产

二、核心原则

原则一:简洁是关键

上下文窗口是公共资源。技能与 AI 需要的其他所有内容共享上下文窗口:系统提示、对话历史、其他技能的元数据以及实际的用户请求。

默认假设:AI 已经非常聪明。 只添加 AI 还没有的上下文。挑战每条信息:

  • 「AI 真的需要这个解释吗?」
  • 「这段文字值得它的 token 成本吗?」

优先使用简洁的示例,而不是冗长的解释。

原则二:设置适当的自由度

将具体程度与任务的脆弱性和可变性相匹配:

自由度 实现方式 适用场景
高自由度 基于文本的说明 多种方法都有效、决策取决于上下文
中等自由度 带参数的伪代码或脚本 有首选模式、可接受一些变化
低自由度 特定脚本,少量参数 操作脆弱易出错、一致性至关重要

类比:AI 像探索者走在路上——有悬崖的狭窄桥梁需要护栏(低自由度),开阔的田野允许多条路线(高自由度)。


三、技能的目录结构

每个技能由必需的 SKILL.md 文件和可选的捆绑资源组成:

1
2
3
4
5
6
7
8
9
10
skill-name/
├── SKILL.md (必需)
│ ├── YAML frontmatter 元数据(必需)
│ │ ├── name: (必需)
│ │ └── description:(必需)
│ └── Markdown 说明 (必需)
└── 捆绑资源 (可选)
├── scripts/ - 可执行代码(Python/Bash/等)
├── references/ - 需要时加载到上下文中的文档
└── assets/ - 输出中使用的文件(模板、图标、字体等)

SKILL.md(必需)

每个 SKILL.md 包含两部分:

  • Frontmatter(YAML):包含 namedescription 字段。这是 AI 读取以确定何时使用技能的唯一字段,因此清晰全面非常重要。
  • 正文(Markdown):使用技能的说明和指导。仅在技能触发后加载。

捆绑资源(可选)

scripts/(脚本)

用于需要确定性可靠性或重复重写的任务的可执行代码。

  • 何时包含:当相同的代码被重复重写,或需要确定性可靠性时
  • 示例scripts/rotate_pdf.py(PDF 旋转任务)
  • 优点:token 高效、确定性强,可在不加载上下文的情况下执行
  • 注意:脚本仍可能需要被 AI 读取以进行环境特定调整

references/(参考资料)

旨在根据需要加载到上下文中以告知 AI 思考过程的文档。

  • 何时包含:AI 在工作时应参考的文档
  • 示例references/finance.mdreferences/mnda.mdreferences/api_docs.md
  • 用例:数据库模式、API 文档、领域知识、公司政策
  • 优点:保持 SKILL.md 精简,仅在需要时加载
  • 最佳实践:文件超过 10k 字时,在 SKILL.md 中包含 grep 搜索模式
  • 避免重复:信息只存在于 SKILL.md 或参考文件中,不要两者都有

assets/(资产)

不加载到上下文中,而是在 AI 生成的输出中直接使用的文件。

  • 何时包含:技能需要在最终输出中使用的文件时
  • 示例assets/logo.pngassets/slides.pptxassets/frontend-template/
  • 用例:模板、图像、图标、样板代码、字体

不应包含的内容

技能应只包含直接支持其功能的基本文件,不要创建多余的文档:

  • README.md
  • INSTALLATION_GUIDE.md
  • QUICK_REFERENCE.md
  • CHANGELOG.md

四、渐进式披露设计原则

技能使用三级加载系统来有效管理上下文:

层级 内容 加载时机 大小建议
第一级 元数据(名称 + 描述) 始终在上下文中 ~100 字
第二级 SKILL.md 正文 技能触发时 <5k 字
第三级 捆绑资源 AI 按需加载 无限制

核心原则: 当技能支持多个变体时,在 SKILL.md 中只保留核心工作流程和选择指导,将特定变体的详细信息移至单独的参考文件。

渐进式披露模式

模式一:带参考的高级指南

1
2
3
4
5
6
7
8
9
10
11
# PDF 处理

## 快速入门

使用 pdfplumber 提取文本:[代码示例]

## 高级功能

- **表单填充**:完整指南见 [FORMS.md](FORMS.md)
- **API 参考**:所有方法见 [REFERENCE.md](REFERENCE.md)
- **示例**:常见模式见 [EXAMPLES.md](EXAMPLES.md)

AI 仅在需要时加载 FORMS.md、REFERENCE.md 或 EXAMPLES.md。


模式二:特定领域组织

对于具有多个领域的技能,按领域组织内容以避免加载不相关的上下文:

1
2
3
4
5
6
7
bigquery-skill/
├── SKILL.md (概述和导航)
└── reference/
├── finance.md (收入、计费指标)
├── sales.md (机会、管道)
├── product.md (API 使用、功能)
└── marketing.md (活动、归因)

当用户询问销售指标时,AI 只读取 sales.md。同理,支持多框架的技能也按变体组织:

1
2
3
4
5
6
cloud-deploy/
├── SKILL.md (工作流程 + 提供商选择)
└── references/
├── aws.md (AWS 部署模式)
├── gcp.md (GCP 部署模式)
└── azure.md (Azure 部署模式)

模式三:条件详情

1
2
3
4
5
6
7
8
9
10
11
12
# DOCX 处理

## 创建文档

使用 docx-js 创建新文档。见 [DOCX-JS.md](DOCX-JS.md)。

## 编辑文档

对于简单的编辑,直接修改 XML。

**对于跟踪更改**:见 [REDLINING.md](REDLINING.md)
**对于 OOXML 详情**:见 [OOXML.md](OOXML.md)

重要指南:

  • 避免深度嵌套的引用 —— 保持引用从 SKILL.md 一级深度,所有参考文件都应直接从 SKILL.md 链接
  • 构建较长的参考文件 —— 超过 100 行的文件,在顶部包含目录,以便 AI 预览时可以看到完整范围

五、技能创建六步流程

步骤 名称 说明
步骤一 理解技能 通过具体示例理解技能的使用模式
步骤二 规划内容 分析可重用的脚本、参考资料和资产
步骤三 初始化 运行 init_skill.py 生成技能目录
步骤四 编辑技能 实现资源,编写 SKILL.md
步骤五 打包 运行 package_skill.py 生成 .skill 文件
步骤六 迭代 根据实际使用反馈持续改进

步骤一:通过具体示例理解技能

仅当技能的使用模式已经清楚理解时才跳过此步骤。即使在使用现有技能时,它仍然有价值。

要创建有效的技能,需要清楚理解如何使用该技能的具体示例。例如,构建图像编辑器技能时,需要问:

  • 「图像编辑器技能应该支持什么功能?编辑、旋转,还有其他吗?」
  • 「你能给出一些如何使用此技能的示例吗?」
  • 「用户会说什么来触发此技能?」

避免在单条消息中提出太多问题。从最重要的问题开始,根据需要跟进。

当对技能应支持的功能有清晰认识时,结束此步骤。

步骤二:规划可重用的技能内容

将具体示例转化为有效技能,通过以下方式分析每个示例:

  1. 考虑如何从头开始执行示例
  2. 确定在重复执行这些工作流程时,哪些脚本、参考资料和资产会有帮助

示例一:构建 pdf-editor 技能

  • 旋转 PDF 需要每次重写相同的代码
  • scripts/rotate_pdf.py 脚本应存储在技能中

示例二:构建 frontend-webapp-builder 技能

  • 编写前端 Web 应用每次都需要相同的样板 HTML/React
  • → 包含样板文件的 assets/hello-world/ 模板应存储在技能中

示例三:构建 big-query 技能

  • 查询 BigQuery 需要每次重新发现表模式和关系
  • → 记录表模式的 references/schema.md 文件应存储在技能中

步骤三:初始化技能

从头开始创建新技能时,始终运行 init_skill.py 脚本:

1
scripts/init_skill.py <skill-name> --path <output-directory>

该脚本将:

  • 在指定路径创建技能目录
  • 生成带有适当 frontmatter 和 TODO 占位符的 SKILL.md 模板
  • 创建示例资源目录:scripts/references/assets/
  • 在每个目录中添加可以自定义或删除的示例文件

步骤四:编辑技能

编辑技能时,记住该技能是为另一个 AI 实例使用而创建的。包含对 AI 有益且不明显的信息。

学习经过验证的设计模式

根据技能需求查阅这些有用的指南:

  • 多步骤流程:有关顺序工作流程和条件逻辑,见 references/workflows.md
  • 特定输出格式或质量标准:有关模板和示例模式,见 references/output-patterns.md

从可重用内容开始

从确定的可重用资源开始实现:scripts/references/assets/ 文件。

注意:此步骤可能需要用户输入。例如,实现 brand-guidelines 技能时,用户可能需要提供品牌资产或模板。

添加的脚本必须通过实际运行来测试,确保没有错误且输出符合预期。不需要的示例文件应删除。

更新 SKILL.md

写作指南: 始终使用祈使句/不定式形式。

Frontmatter 字段:

  • name:技能名称
  • description:主要触发机制,帮助 AI 理解何时使用该技能。应包括技能的功能以及具体触发器/上下文

示例描述(docx 技能):「全面的文档创建、编辑和分析,支持跟踪更改、注释、格式保留和文本提取。当 AI 需要处理专业文档(.docx 文件)时使用,用于:(1) 创建新文档,(2) 修改或编辑内容,(3) 处理跟踪更改,(4) 添加注释,或任何其他文档任务」

注意:不要在 YAML frontmatter 中包含任何其他字段。

步骤五:打包技能

技能开发完成后,打包成可分发的 .skill 文件:

1
2
3
4
5
# 基本用法
scripts/package_skill.py <path/to/skill-folder>

# 指定输出目录
scripts/package_skill.py <path/to/skill-folder> ./dist

打包脚本将自动:

  1. 验证技能,检查:
    • YAML frontmatter 格式和必需字段
    • 技能命名约定和目录结构
    • 描述的完整性和质量
    • 文件组织和资源引用
  2. 打包技能(验证通过后),创建以技能命名的 .skill 文件(本质是带 .skill 扩展名的 zip 文件)

如果验证失败,脚本将报告错误并退出。修复验证错误后再次运行。

步骤六:迭代

测试技能后,根据实际使用反馈进行改进。

迭代工作流程:

  1. 在实际任务中使用技能
  2. 注意困难或低效之处
  3. 确定应如何更新 SKILL.md 或捆绑资源
  4. 实施更改并再次测试

总结

维度 核心建议
内容精简 只添加 AI 还没有的上下文,不解释显而易见的事情
结构清晰 三级加载系统,按需披露
资源分类 scripts/references/assets 三类,各司其职
描述精准 description 是触发机制,必须清晰全面
持续迭代 在实际使用中发现问题,持续改进

Skill-Creator 的本质,是把「人类的专业知识」压缩成「AI 可复用的工程模块」。每一个好的 Skill,都是一次知识的结构化沉淀。