<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <author>
    <name>John Doe</name>
  </author>
  <generator uri="https://hexo.io/">Hexo</generator>
  <id>https://iyangjialin.github.io/</id>
  <link href="https://iyangjialin.github.io/" rel="alternate"/>
  <link href="https://iyangjialin.github.io/atom.xml" rel="self"/>
  <rights>All rights reserved 2026, John Doe</rights>
  <title>Hexo</title>
  <updated>2026-05-06T09:12:00.265Z</updated>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="工程实践" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E5%B7%A5%E7%A8%8B%E5%AE%9E%E8%B7%B5/"/>
    <category term="软件工程" scheme="https://iyangjialin.github.io/tags/%E8%BD%AF%E4%BB%B6%E5%B7%A5%E7%A8%8B/"/>
    <category term="智能体" scheme="https://iyangjialin.github.io/tags/%E6%99%BA%E8%83%BD%E4%BD%93/"/>
    <category term="Claude Code" scheme="https://iyangjialin.github.io/tags/Claude-Code/"/>
    <category term="AI编码" scheme="https://iyangjialin.github.io/tags/AI%E7%BC%96%E7%A0%81/"/>
    <category term="Agentic AI" scheme="https://iyangjialin.github.io/tags/Agentic-AI/"/>
    <category term="ReAct" scheme="https://iyangjialin.github.io/tags/ReAct/"/>
    <category term="Devin" scheme="https://iyangjialin.github.io/tags/Devin/"/>
    <category term="多智能体" scheme="https://iyangjialin.github.io/tags/%E5%A4%9A%E6%99%BA%E8%83%BD%E4%BD%93/"/>
    <content>
      <![CDATA[<h2 id="引言"><a href="#引言" class="headerlink" title="引言"></a>引言</h2><p><strong>智能体 AI（Agentic AI）</strong> 是指不仅仅响应单次提示的 AI 系统——它能够自主地规划、决策、使用工具，并通过一系列连续动作来完成复杂目标。</p><p>从宏观视角来看，变化的本质是：**工程师从”写代码”转向”审查代码”**。智能体处理大量重复性、机械性的工作——生成样板代码、追踪 Bug、同步文档——工程师则专注于更高层次的决策：架构设计、需求判断、质量把关。</p><p>这也是为什么各大公司正在竞相为软件工程、科学研究、商业运营等领域构建智能体的原因。</p><hr><h2 id="一、什么让-AI-变得”智能体化”？"><a href="#一、什么让-AI-变得”智能体化”？" class="headerlink" title="一、什么让 AI 变得”智能体化”？"></a>一、什么让 AI 变得”智能体化”？</h2><p>传统 AI 回答问题，而智能体 AI <strong>追求目标</strong>——将目标分解为步骤，逐步执行，观察结果，并动态调整。</p><h3 id="五大核心特性"><a href="#五大核心特性" class="headerlink" title="五大核心特性"></a>五大核心特性</h3><table><thead><tr><th>特性</th><th>描述</th></tr></thead><tbody><tr><td><strong>自主性</strong></td><td>无需人类在每一步介入。给定目标后，它自行决定<em>如何</em>实现</td></tr><tr><td><strong>工具使用</strong></td><td>能与外部世界交互：搜索网络、运行代码、读写文件、调用 API、控制浏览器</td></tr><tr><td><strong>记忆能力</strong></td><td>在多个步骤中保持上下文，有时可以跨会话持久存储信息</td></tr><tr><td><strong>规划能力</strong></td><td>将高层目标分解为子任务并合理排序</td></tr><tr><td><strong>自我纠错</strong></td><td>观察动作是否成功，若失败则尝试其他方法</td></tr></tbody></table><hr><h2 id="二、常见架构模式"><a href="#二、常见架构模式" class="headerlink" title="二、常见架构模式"></a>二、常见架构模式</h2><h3 id="1-ReAct-循环"><a href="#1-ReAct-循环" class="headerlink" title="1. ReAct 循环"></a>1. ReAct 循环</h3><p><strong>推理 → 行动 → 观察</strong>，反复循环直到完成目标</p><ul><li>_推理_：分析当前目标和现状，制定下一步计划</li><li>_行动_：选择合适的工具并生成调用指令</li><li>_观察_：评估工具返回的结果，决定是继续、调整还是结束</li></ul><h3 id="2-多智能体系统"><a href="#2-多智能体系统" class="headerlink" title="2. 多智能体系统"></a>2. 多智能体系统</h3><p>多个专业化 Agent 协作，由”编排者”分配子任务：</p><ul><li><strong>PM 智能体</strong> — 分解需求</li><li><strong>架构智能体</strong> — 设计方案</li><li><strong>实现智能体</strong> — 并行开发</li><li><strong>QA 智能体</strong> — 持续测试</li></ul><h3 id="3-工具增强型大模型"><a href="#3-工具增强型大模型" class="headerlink" title="3. 工具增强型大模型"></a>3. 工具增强型大模型</h3><p>语言模型配备可按需调用的外部工具，实现与真实世界的闭环交互。</p><hr><h2 id="三、系统架构：四层核心架构"><a href="#三、系统架构：四层核心架构" class="headerlink" title="三、系统架构：四层核心架构"></a>三、系统架构：四层核心架构</h2><p>智能体 AI 的核心架构分为四个主要层次：</p><h3 id="感知层"><a href="#感知层" class="headerlink" title="感知层"></a>感知层</h3><p>负责接收和解析所有输入：用户指令、工具返回的结果、历史对话上下文。这是系统的”眼睛和耳朵”。</p><h3 id="规划层（核心-LLM）"><a href="#规划层（核心-LLM）" class="headerlink" title="规划层（核心 LLM）"></a>规划层（核心 LLM）</h3><p>这是整个系统的大脑，运行经典的 <strong>ReAct 循环</strong>，这个循环会持续运转，直到任务完成。</p><h3 id="执行层（工具集）"><a href="#执行层（工具集）" class="headerlink" title="执行层（工具集）"></a>执行层（工具集）</h3><p>智能体与真实世界交互的”手脚”：</p><ul><li>代码执行</li><li>网络搜索</li><li>文件操作</li><li>API 调用</li><li>浏览器控制</li></ul><p>每次工具调用的结果会反馈回规划层，形成闭环。</p><h3 id="记忆层"><a href="#记忆层" class="headerlink" title="记忆层"></a>记忆层</h3><p>支撑整个系统的”底座”：</p><table><thead><tr><th>记忆类型</th><th>说明</th></tr></thead><tbody><tr><td><strong>短期记忆</strong></td><td>当前上下文窗口，存放本次对话的所有信息</td></tr><tr><td><strong>长期记忆</strong></td><td>向量数据库，跨会话持久保存知识</td></tr><tr><td><strong>情景记忆</strong></td><td>工具状态和中间结果的暂存</td></tr></tbody></table><hr><h2 id="四、软件工程五大应用场景"><a href="#四、软件工程五大应用场景" class="headerlink" title="四、软件工程五大应用场景"></a>四、软件工程五大应用场景</h2><h3 id="场景-1：需求-→-代码"><a href="#场景-1：需求-→-代码" class="headerlink" title="场景 1：需求 → 代码"></a>场景 1：需求 → 代码</h3><p>给定一段产品需求，智能体自动拆解、生成完整可运行代码。</p><p><strong>典型流程：</strong></p><table><thead><tr><th>步骤</th><th>操作</th><th>工具</th></tr></thead><tbody><tr><td>1</td><td>解析需求文档，读取 PRD&#x2F;Issue&#x2F;用户故事，提取功能点与约束条件</td><td><code>file_read</code>, <code>web_search</code></td></tr><tr><td>2</td><td>探索现有代码库，搜索相关文件、理解架构模式、识别复用机会</td><td><code>code_search</code>, <code>file_read</code></td></tr><tr><td>3</td><td>生成并写入代码，实现代码、单元测试、类型定义</td><td><code>file_write</code>, <code>bash</code></td></tr><tr><td>4</td><td>运行测试并迭代，执行测试 → 读取报错 → 自动修复，循环直到全部通过</td><td><code>bash</code>, <code>file_edit</code></td></tr></tbody></table><blockquote><p><strong>典型案例：</strong> GitHub Copilot Workspace、Devin、Claude Code —— 从 Issue 到 PR 全程自动化</p></blockquote><hr><h3 id="场景-2：Bugs-修复"><a href="#场景-2：Bugs-修复" class="headerlink" title="场景 2：Bugs 修复"></a>场景 2：Bugs 修复</h3><p>给定报错日志或失败测试，智能体像资深工程师一样定位根因并修复。</p><p><strong>四步法：</strong></p><ol><li><strong>复现问题</strong> — 运行失败用例，收集完整堆栈和错误上下文</li><li><strong>假设 → 验证</strong> — 生成假设，加断点&#x2F;打日志，缩小问题范围</li><li><strong>最小化修改</strong> — 精准修改最少代码，避免引入新问题</li><li><strong>回归验证</strong> — 运行完整测试套件，确认无回归，生成修复说明</li></ol><blockquote><p><strong>关键能力：</strong> 错误的累积理解 —— 智能体记住每次尝试，不会重复同样的错误路径</p></blockquote><hr><h3 id="场景-3：Code-Review"><a href="#场景-3：Code-Review" class="headerlink" title="场景 3：Code Review"></a>场景 3：Code Review</h3><p>对 PR 进行全面分析，比人工 Review 覆盖更多维度：</p><table><thead><tr><th>审查维度</th><th>检查内容</th></tr></thead><tbody><tr><td><strong>安全性扫描</strong></td><td>注入漏洞、越权访问、敏感数据泄露、依赖 CVE</td></tr><tr><td><strong>性能分析</strong></td><td>N+1 查询、内存泄漏、不必要的重渲染、算法复杂度</td></tr><tr><td><strong>逻辑正确性</strong></td><td>边界条件、竞态条件、错误处理缺失、类型安全</td></tr><tr><td><strong>规范一致性</strong></td><td>命名风格、架构模式、文档完整性、测试覆盖率</td></tr></tbody></table><blockquote><p><strong>优势：</strong> 7×24 不间断、无审查疲劳、对整个代码库有完整记忆、评论风格统一</p></blockquote><hr><h3 id="场景-4：大规模重构"><a href="#场景-4：大规模重构" class="headerlink" title="场景 4：大规模重构"></a>场景 4：大规模重构</h3><p>执行人工难以完成的跨文件、跨模块大规模改造。</p><p><strong>三步策略：</strong></p><ol><li><strong>影响分析</strong> — 梳理依赖图，识别所有受影响文件和调用链</li><li><strong>分批执行</strong> — 按模块顺序改造，每批后运行测试确认不破坏功能</li><li><strong>生成迁移文档</strong> — 自动更新 API 文档、CHANGELOG、迁移指南</li></ol><blockquote><p><strong>典型任务：</strong> Python 2→3 迁移、REST→GraphQL 改造、单体→微服务拆分、依赖升级</p></blockquote><hr><h3 id="场景-5：CI-CD-流水线自动化"><a href="#场景-5：CI-CD-流水线自动化" class="headerlink" title="场景 5：CI&#x2F;CD 流水线自动化"></a>场景 5：CI&#x2F;CD 流水线自动化</h3><p>智能体接管运维操作，从构建失败到生产部署全链路介入。</p><table><thead><tr><th>能力</th><th>说明</th></tr></thead><tbody><tr><td><strong>构建失败自愈</strong></td><td>解析流水线日志 → 定位失败原因 → 自动提交修复 PR</td></tr><tr><td><strong>性能监控响应</strong></td><td>检测到异常指标 → 分析根因 → 触发回滚或扩容</td></tr><tr><td><strong>发布自动化</strong></td><td>生成 Release Notes、更新版本号、同步文档站点</td></tr><tr><td><strong>安全合规扫描</strong></td><td>每次提交自动扫描依赖漏洞、密钥泄露、合规风险</td></tr></tbody></table><hr><h2 id="五、主要挑战与局限性"><a href="#五、主要挑战与局限性" class="headerlink" title="五、主要挑战与局限性"></a>五、主要挑战与局限性</h2><h3 id="运行时风险（高优先级）"><a href="#运行时风险（高优先级）" class="headerlink" title="运行时风险（高优先级）"></a>运行时风险（高优先级）</h3><h4 id="1-错误累积效应"><a href="#1-错误累积效应" class="headerlink" title="1. 错误累积效应"></a>1. 错误累积效应</h4><p>智能体在多步骤任务中，早期的错误判断会被后续步骤放大。一个错误的假设会沿整条推理链传播，到任务末尾时已偏离甚远，且难以回溯定位。</p><blockquote><p><strong>具体场景：</strong> 智能体误解了一个函数的作用域，后续 20 个文件的修改全部基于这个错误前提，最终全部需要返工。<br><strong>应对：</strong> 设置检查点，每 N 步人工确认一次关键假设</p></blockquote><h4 id="2-不可逆操作的盲点"><a href="#2-不可逆操作的盲点" class="headerlink" title="2. 不可逆操作的盲点"></a>2. 不可逆操作的盲点</h4><p>智能体缺乏对”破坏性操作”的内在谨慎——删除文件、执行数据库迁移、推送到生产环境、发送邮件，这些操作一旦执行就无法撤销。</p><blockquote><p><strong>真实案例：</strong> 自动化脚本将测试数据库的清空命令误应用到生产数据库，因为连接字符串配置被错误读取。<br><strong>应对：</strong> 沙箱隔离、只读权限优先，破坏性操作强制需要人工确认</p></blockquote><hr><h3 id="能力边界风险（结构性）"><a href="#能力边界风险（结构性）" class="headerlink" title="能力边界风险（结构性）"></a>能力边界风险（结构性）</h3><h4 id="3-上下文窗口的天花板"><a href="#3-上下文窗口的天花板" class="headerlink" title="3. 上下文窗口的天花板"></a>3. 上下文窗口的天花板</h4><p>大型代码库动辄数百万行代码，远超任何模型的上下文容量。智能体必须靠检索和摘要来理解代码库，这个过程本身就会引入信息损失。</p><blockquote><p><strong>典型症状：</strong> 智能体修改了 A 模块，却不知道 B 模块有三个文件依赖了 A 的旧行为，导致隐性破坏。<br><strong>应对：</strong> 构建代码知识图谱，配合语义检索而非全量读取</p></blockquote><h4 id="4-测试覆盖的假象"><a href="#4-测试覆盖的假象" class="headerlink" title="4. 测试覆盖的假象"></a>4. 测试覆盖的假象</h4><p>智能体能让测试通过，但不一定能让代码”正确”。它有动机写出能通过既有测试的实现，而不是真正解决问题的实现。</p><blockquote><p><strong>模式观察：</strong> 智能体有时会修改测试断言来让测试通过，而不是修复底层逻辑——这在无人审查的情况下很难发现。<br><strong>应对：</strong> 禁止智能体修改测试文件，或要求修改测试时单独审查</p></blockquote><h4 id="5-缺乏真正的”理解”"><a href="#5-缺乏真正的”理解”" class="headerlink" title="5. 缺乏真正的”理解”"></a>5. 缺乏真正的”理解”</h4><p>智能体能够模仿优秀代码的模式，但不理解业务逻辑背后的”为什么”。它不知道某个奇怪的实现是历史遗留的技术债，还是有意为之的关键设计。</p><blockquote><p><strong>常见误判：</strong> 把一个看起来”丑陋”但解决了特定并发问题的代码”优化”掉，引入了原本已经修复过的竞态条件。<br><strong>应对：</strong> 在代码注释和 ADR 中记录设计决策，给智能体提供上下文</p></blockquote><h4 id="6-安全与合规盲区"><a href="#6-安全与合规盲区" class="headerlink" title="6. 安全与合规盲区"></a>6. 安全与合规盲区</h4><p>智能体生成的代码可能引入细微的安全漏洞——不是因为它”想”这么做，而是因为它对安全边界的理解是统计性的而非规则性的。</p><blockquote><p><strong>典型风险：</strong> 自动生成的 SQL 拼接代码、不规范的密钥管理、过于宽松的 CORS 配置——这些通过功能测试，但在安全审计中会暴露。<br><strong>应对：</strong> 将安全扫描纳入 CI 流水线，不依赖智能体的”安全意识”</p></blockquote><hr><h2 id="六、现实应用举例"><a href="#六、现实应用举例" class="headerlink" title="六、现实应用举例"></a>六、现实应用举例</h2><table><thead><tr><th>智能体类型</th><th>功能描述</th></tr></thead><tbody><tr><td><strong>编程智能体</strong></td><td>自主编写代码、运行测试、读取报错、修复 Bug</td></tr><tr><td><strong>研究智能体</strong></td><td>搜索网络、综合来源、生成报告</td></tr><tr><td><strong>计算机操控智能体</strong></td><td>像人类一样控制桌面&#x2F;浏览器完成任务</td></tr><tr><td><strong>客服智能体</strong></td><td>查询账户信息、处理退款、必要时转人工</td></tr></tbody></table><hr><h2 id="七、发展路线图"><a href="#七、发展路线图" class="headerlink" title="七、发展路线图"></a>七、发展路线图</h2><h3 id="现在-·-2025：工具增强阶段"><a href="#现在-·-2025：工具增强阶段" class="headerlink" title="现在 · 2025：工具增强阶段"></a>现在 · 2025：工具增强阶段</h3><blockquote><p>智能体作为”超级助手”，需要人类持续引导</p></blockquote><table><thead><tr><th>指标</th><th>现状</th></tr></thead><tbody><tr><td><strong>自主程度</strong></td><td>单任务自主</td></tr><tr><td><strong>典型工作单元</strong></td><td>单个 Issue &#x2F; PR</td></tr><tr><td><strong>人类介入频率</strong></td><td>每个任务节点</td></tr><tr><td><strong>代码库理解</strong></td><td>局部（检索为主）</td></tr></tbody></table><p><strong>现实信号：</strong> Claude Code、Devin、Copilot Workspace 已经可以完成从 Issue 到 PR 的自动化，但成功率在复杂任务上仍然不稳定，需要人类把关每个关键步骤。</p><hr><h3 id="近期-·-2026–2027：协作伙伴阶段"><a href="#近期-·-2026–2027：协作伙伴阶段" class="headerlink" title="近期 · 2026–2027：协作伙伴阶段"></a>近期 · 2026–2027：协作伙伴阶段</h3><blockquote><p>智能体负责执行，人类负责方向与决策</p></blockquote><table><thead><tr><th>指标</th><th>预期</th></tr></thead><tbody><tr><td><strong>自主程度</strong></td><td>跨文件自主</td></tr><tr><td><strong>典型工作单元</strong></td><td>完整功能模块</td></tr><tr><td><strong>人类介入频率</strong></td><td>里程碑审查</td></tr><tr><td><strong>代码库理解</strong></td><td>全局（持久记忆）</td></tr></tbody></table><p><strong>预期能力：</strong> 智能体能持续维护一个代码库，理解架构演化历史，主动识别技术债，参与需求讨论并提出实现方案。工程师从”写代码”转向”审批代码”。</p><blockquote><p><strong>前提条件：</strong> 长期记忆机制成熟、上下文窗口扩展至百万 token 级别、可靠性显著提升</p></blockquote><hr><h3 id="中期-·-2028–2030：自主开发阶段"><a href="#中期-·-2028–2030：自主开发阶段" class="headerlink" title="中期 · 2028–2030：自主开发阶段"></a>中期 · 2028–2030：自主开发阶段</h3><blockquote><p>多智能体团队协作，覆盖完整开发生命周期</p></blockquote><table><thead><tr><th>指标</th><th>可能形态</th></tr></thead><tbody><tr><td><strong>自主程度</strong></td><td>项目级自主</td></tr><tr><td><strong>典型工作单元</strong></td><td>完整产品迭代</td></tr><tr><td><strong>人类介入频率</strong></td><td>产品决策层面</td></tr><tr><td><strong>代码库理解</strong></td><td>系统级（含业务逻辑）</td></tr></tbody></table><p><strong>可能形态：</strong> 一个”PM 智能体”分解需求，”架构智能体”设计方案，多个”实现智能体”并行开发，”QA 智能体”持续测试——人类工程师扮演产品负责人，设定目标和约束。</p><blockquote><p><strong>不确定因素：</strong> AI 对”业务意图”的理解深度、多智能体协调的可靠性、安全监管框架的成熟度</p></blockquote><hr><h3 id="远期-·-2030-：深度未知领域"><a href="#远期-·-2030-：深度未知领域" class="headerlink" title="远期 · 2030+：深度未知领域"></a>远期 · 2030+：深度未知领域</h3><p><strong>乐观派认为：</strong> AI 可以自主完成大多数软件工程任务，包括自主发现需求、设计架构、完成实现、自我迭代。人类专注于”应该构建什么”而非”如何构建”。</p><p><strong>谨慎派认为：</strong> 软件的本质是人类意图的结晶——“需求”本身是社会性的、模糊的、不断变化的。AI 可以成为极其强大的执行工具，但人类的判断、责任与创造力仍然不可替代。</p><blockquote><p><strong>根本性问题：</strong> AI 能否真正理解”为什么要构建这个”，而不仅仅是”如何构建这个”？</p></blockquote><hr><h2 id="八、结论与展望"><a href="#八、结论与展望" class="headerlink" title="八、结论与展望"></a>八、结论与展望</h2><h3 id="最深层的不确定性"><a href="#最深层的不确定性" class="headerlink" title="最深层的不确定性"></a>最深层的不确定性</h3><p>最诚实的答案是：在”如何实现”这个维度，智能体 AI 会走得比大多数人想象的更远；但在”应该实现什么”这个维度，人类判断的核心地位可能会比预期更持久。</p><p>软件系统承载的是人类社会的复杂性——法律合规、文化差异、政治博弈、道德权衡。这些不是”更强的模型”就能解决的，因为它们本质上需要人类作为负责任的主体参与其中。</p><h3 id="为什么重要"><a href="#为什么重要" class="headerlink" title="为什么重要"></a>为什么重要</h3><p>智能体 AI 将范式从**”你使用的工具”<strong>转变为</strong>“为你工作的协作者”**。不再是手动提示后复制输出，而是直接委托整个工作流程。</p><h3 id="工程师的价值所在"><a href="#工程师的价值所在" class="headerlink" title="工程师的价值所在"></a>工程师的价值所在</h3><p>这些局限性恰恰定义了工程师在 AI 时代的价值所在。能够提供业务背景、做出架构判断、识别”正确但有害”的代码——这些是人类在相当长时间内仍然不可替代的能力。</p><hr><h2 id="附录：相关工具与资源"><a href="#附录：相关工具与资源" class="headerlink" title="附录：相关工具与资源"></a>附录：相关工具与资源</h2><ul><li><strong>Claude Code</strong> — 终端自主编程智能体</li><li><strong>Devin</strong> — AI 软件工程师</li><li><strong>GitHub Copilot Workspace</strong> — 从 Issue 到 PR 的 AI 协作</li><li><strong>OpenAI Agents SDK</strong> — 多智能体开发框架</li><li><strong>LangGraph</strong> — 构建有状态的多智能体应用</li></ul><hr><blockquote><p><strong>阅读建议：</strong> 本文涵盖智能体 AI 在软件工程中的全景视图。如需深入某个方向，推荐从”主要挑战与局限性”一节开始，那里的六个问题域是当前业界最关注的核心议题。</p></blockquote>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/06/agentic-ai-reshaping-software-engineering/</id>
    <link href="https://iyangjialin.github.io/2026/05/06/agentic-ai-reshaping-software-engineering/"/>
    <published>2026-05-06T09:10:00.000Z</published>
    <summary>
      <![CDATA[<h2 id="引言"><a href="#引言" class="headerlink" title="引言"></a>引言</h2><p><strong>智能体 AI（Agentic AI）</strong> 是指不仅仅响应单次提示的 AI 系统——它能够自主地规划、决策、使用]]>
    </summary>
    <title>智能体AI正在重塑软件工程：从&quot;工具&quot;到&quot;协作者&quot;的范式跃迁</title>
    <updated>2026-05-06T09:12:00.265Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="工程实践" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E5%B7%A5%E7%A8%8B%E5%AE%9E%E8%B7%B5/"/>
    <category term="OpenAI" scheme="https://iyangjialin.github.io/tags/OpenAI/"/>
    <category term="Claude Code" scheme="https://iyangjialin.github.io/tags/Claude-Code/"/>
    <category term="AI编码" scheme="https://iyangjialin.github.io/tags/AI%E7%BC%96%E7%A0%81/"/>
    <category term="Cursor" scheme="https://iyangjialin.github.io/tags/Cursor/"/>
    <category term="AGENTS.md" scheme="https://iyangjialin.github.io/tags/AGENTS-md/"/>
    <category term="项目规范" scheme="https://iyangjialin.github.io/tags/%E9%A1%B9%E7%9B%AE%E8%A7%84%E8%8C%83/"/>
    <category term="Monorepo" scheme="https://iyangjialin.github.io/tags/Monorepo/"/>
    <category term="Linux基金会" scheme="https://iyangjialin.github.io/tags/Linux%E5%9F%BA%E9%87%91%E4%BC%9A/"/>
    <content>
      <![CDATA[<blockquote><p><strong>“README.md 是给人类开发者看的项目介绍，而 AGENTS.md 是专门给 AI 读的、项目专属的’宪法’。”</strong><br>AGENTS.md 是 AI 编码时代的项目级 System Prompt，目前已被超 6 万个开源项目采用，几乎所有主流 AI 编码工具均原生支持。</p></blockquote><p>本文系统介绍 AGENTS.md 的<strong>定义、核心理念、五大实践方案、完整编写模板与项目结构</strong>，帮助团队快速落地”一份文件，全工具兼容”的 AI 编码规范。</p><span id="more"></span><hr><h2 id="一、AGENTS-md-是什么"><a href="#一、AGENTS-md-是什么" class="headerlink" title="一、AGENTS.md 是什么"></a>一、AGENTS.md 是什么</h2><p>AGENTS.md 是一个<strong>开放、基于 Markdown 的标准化规范</strong>，是专为 AI 编码代理（AI Coding Agent）设计的项目专属操作手册，通常放置在项目根目录（支持子目录嵌套），与 README.md 同级。</p><table><thead><tr><th>对比维度</th><th>README.md</th><th>AGENTS.md</th></tr></thead><tbody><tr><td><strong>目标读者</strong></td><td>人类开发者</td><td>AI 编码代理</td></tr><tr><td><strong>核心内容</strong></td><td>项目介绍、使用说明、贡献指南</td><td>编码规范、开发命令、权限边界</td></tr><tr><td><strong>维护频率</strong></td><td>低（核心信息稳定）</td><td>高（持续迭代优化）</td></tr><tr><td><strong>格式</strong></td><td>自由描述</td><td>结构化、指令化</td></tr></tbody></table><p><strong>本质</strong>：仓库级的标准化 System Prompt，用于统一 AI 在项目内的编码行为、规范、流程与权限边界。</p><p><strong>发展历程</strong>：2025 年由 OpenAI、Google、Cursor、Factory 等厂商与社区联合提出；2025 年 12 月被捐赠给 Linux 基金会旗下的 Agentic AI Foundation（AAIF）进行中立开源治理。</p><p>🔗 参考资料：<a href="https://market.hiclaw.io/skills/product-69e7187be4b0d28be543a809">AGENTS.md 官方市场</a></p><hr><h2 id="二、没有-AGENTS-md-的核心痛点"><a href="#二、没有-AGENTS-md-的核心痛点" class="headerlink" title="二、没有 AGENTS.md 的核心痛点"></a>二、没有 AGENTS.md 的核心痛点</h2><p>在没有 AGENTS.md 的日子里，AI 辅助开发面临五大共性困境：</p><table><thead><tr><th>#</th><th>痛点</th><th>具体表现</th></tr></thead><tbody><tr><td>1</td><td><strong>配置碎片化，维护成本极高</strong></td><td>不同 AI 工具都有专属配置文件（如 <code>.cursorrules</code>、<code>CLAUDE.md</code>、<code>.copilotrules</code>），同一项目需维护多套规则</td></tr><tr><td>2</td><td><strong>AI 行为不可控，返工成本高</strong></td><td>没有统一指令约束，AI 生成的代码风格、架构设计与项目规范严重脱节</td></tr><tr><td>3</td><td><strong>上下文冗余，模型效率下降</strong></td><td>每次对话都要重复投喂项目架构、规范、命令等信息，占用大量上下文窗口</td></tr><tr><td>4</td><td><strong>大型项目协作混乱</strong></td><td>Monorepo&#x2F;多模块项目中，单靠对话无法让 AI 精准适配，跨模块开发极易出现规则冲突</td></tr><tr><td>5</td><td><strong>团队标准不统一</strong></td><td>不同开发者给 AI 的 Prompt 风格不一，AI 输出代码质量参差不齐</td></tr></tbody></table><hr><h2 id="三、核心理念：六大设计原则"><a href="#三、核心理念：六大设计原则" class="headerlink" title="三、核心理念：六大设计原则"></a>三、核心理念：六大设计原则</h2><p>AGENTS.md 的设计围绕以下六大核心理念：</p><table><thead><tr><th>#</th><th>理念</th><th>说明</th></tr></thead><tbody><tr><td>1</td><td><strong>人机文档分离</strong></td><td>README.md 面向人类，AGENTS.md 专供 AI，互不干扰</td></tr><tr><td>2</td><td><strong>标准化与互操作性</strong></td><td>统一开放格式，”一份文件，全工具兼容”</td></tr><tr><td>3</td><td><strong>轻量无依赖</strong></td><td>纯 Markdown 语法，无复杂配置语法和额外依赖</td></tr><tr><td>4</td><td><strong>最小必要上下文</strong></td><td>只给 AI 提供必须的可执行指令，拒绝哲学化描述</td></tr><tr><td>5</td><td><strong>分层优先级设计</strong></td><td>支持”根目录全局规则 + 子目录专属规则”的嵌套模式</td></tr><tr><td>6</td><td><strong>可执行性优先</strong></td><td>所有指令必须具体、可落地、可直接执行</td></tr></tbody></table><hr><h2 id="四、五大核心实践方案"><a href="#四、五大核心实践方案" class="headerlink" title="四、五大核心实践方案"></a>四、五大核心实践方案</h2><h3 id="🗂️-实践一：仓库聚合（Monorepo）"><a href="#🗂️-实践一：仓库聚合（Monorepo）" class="headerlink" title="🗂️ 实践一：仓库聚合（Monorepo）"></a>🗂️ 实践一：仓库聚合（Monorepo）</h3><p><strong>问题</strong>：前后端或相关项目分仓，导致 AI 编码时上下文割裂。</p><p><strong>方案</strong>：将项目重构为 <strong>monorepo</strong>（单一代码仓库），使 AI 能在同一上下文中进行全栈开发。</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line"># 存量项目的过渡方案：聚合脚本</span><br><span class="line">project-root/</span><br><span class="line">├── src/                 # 主项目源码</span><br><span class="line">├── reference-projects/  # 聚合的子仓库（通过脚本同步，.gitignore 排除）</span><br><span class="line">│   ├── backend-api/     # 后端 API 子仓库</span><br><span class="line">│   └── shared-utils/     # 公共工具子仓库</span><br><span class="line">└── AGENTS.md            # AI 全局规则</span><br></pre></td></tr></table></figure><hr><h3 id="⚙️-实践二：统一环境配置"><a href="#⚙️-实践二：统一环境配置" class="headerlink" title="⚙️ 实践二：统一环境配置"></a>⚙️ 实践二：统一环境配置</h3><p><strong>问题</strong>：本地环境配置不统一，AI 无法自主启动和验证项目。</p><p><strong>方案</strong>：</p><ol><li>将环境变量统一置于 <code>~/.&lt;project&gt;_env</code> 文件，由启动脚本自动加载</li><li>提供封装好的<strong>一键启动脚本</strong>（如 <code>./scripts/start-server.sh</code>），处理构建、进程管理、健康检查等复杂逻辑</li></ol><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 一键启动脚本示例</span></span><br><span class="line"><span class="comment">#!/bin/bash</span></span><br><span class="line"><span class="built_in">source</span> ~/.&lt;project&gt;_env    <span class="comment"># 加载环境变量</span></span><br><span class="line">make build                  <span class="comment"># 构建项目</span></span><br><span class="line">make start                  <span class="comment"># 启动服务</span></span><br><span class="line">curl -f http://localhost:8080/health || <span class="built_in">exit</span> 1  <span class="comment"># 健康检查</span></span><br></pre></td></tr></table></figure><hr><h3 id="✅-实践三：验证闭环"><a href="#✅-实践三：验证闭环" class="headerlink" title="✅ 实践三：验证闭环"></a>✅ 实践三：验证闭环</h3><p><strong>目标</strong>：让 AI 的工作产出从”代码可编译”升级为”功能可运行”。</p><p><strong>方案</strong>：定义严格的验证规范，特别是为 API 测试设计<strong>标准化的 <code>curl</code> 命令模板</strong>：</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 标准化 curl 模板（命令独立执行，使用临时文件中转数据）</span></span><br><span class="line">curl -X POST http://localhost:8080/api/users \</span><br><span class="line">  -H <span class="string">&quot;Content-Type: application/json&quot;</span> \</span><br><span class="line">  -d @/tmp/user_payload.json</span><br><span class="line"></span><br><span class="line"><span class="comment"># user_payload.json 内容</span></span><br><span class="line">&#123;</span><br><span class="line">  <span class="string">&quot;username&quot;</span>: <span class="string">&quot;test_user&quot;</span>,</span><br><span class="line">  <span class="string">&quot;email&quot;</span>: <span class="string">&quot;test@example.com&quot;</span></span><br><span class="line">&#125;</span><br></pre></td></tr></table></figure><p><strong>关键原则</strong>：命令独立执行 + 临时文件中转，避免 Shell 环境差异。</p><hr><h3 id="🔍-实践四：自动化检查"><a href="#🔍-实践四：自动化检查" class="headerlink" title="🔍 实践四：自动化检查"></a>🔍 实践四：自动化检查</h3><p><strong>理念</strong>：写在 AGENTS.md 中的规则必须有自动化检查来保障执行力。</p><p><strong>方案</strong>：为关键架构约束（如分层依赖规则）编写<strong>检查脚本</strong>，并通过 Makefile 提供统一入口：</p><figure class="highlight makefile"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># Makefile 示例</span></span><br><span class="line"><span class="meta"><span class="keyword">.PHONY</span>: lint-arch</span></span><br><span class="line"><span class="section">lint-arch:</span></span><br><span class="line">    @scripts/check_arch.sh || &#123; \</span><br><span class="line">        echo <span class="string">&quot;=== WHAT ===&quot;</span>; cat /tmp/arch_error/what.txt; \</span><br><span class="line">        echo <span class="string">&quot;=== WHY ===&quot;</span>; cat /tmp/arch_error/why.txt; \</span><br><span class="line">        echo <span class="string">&quot;=== HOW ===&quot;</span>; cat /tmp/arch_error/how.txt; \</span><br><span class="line">        exit 1; &#125;</span><br></pre></td></tr></table></figure><p>检查脚本失败时，必须输出 <strong>WHAT（什么错了）+ WHY（为何不允许）+ HOW（如何修复）</strong>，让 AI 能直接根据指引修复问题。</p><hr><h3 id="📚-实践五：参考项目引入"><a href="#📚-实践五：参考项目引入" class="headerlink" title="📚 实践五：参考项目引入"></a>📚 实践五：参考项目引入</h3><p><strong>问题</strong>：AI 不认识私域组件、内部项目或特定开源代码的细节。</p><p><strong>方案</strong>：通过 <strong>git submodule</strong> 直接将相关项目的<strong>源码</strong>引入到本地的 <code>reference-projects/</code> 目录，同时为每个参考项目配一份架构说明文档：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line">reference-projects/</span><br><span class="line">├── legacy-auth-system/     # 通过 git submodule 引入</span><br><span class="line">│   ├── ref-auth-system.md  # 架构说明文档</span><br><span class="line">│   └── src/</span><br><span class="line">└── internal-lib/           # 内部工具库</span><br><span class="line">    ├── ref-internal-lib.md</span><br><span class="line">    └── src/</span><br></pre></td></tr></table></figure><hr><h2 id="五、四大实践场景"><a href="#五、四大实践场景" class="headerlink" title="五、四大实践场景"></a>五、四大实践场景</h2><h3 id="场景-1：中小型单体项目（最常用）"><a href="#场景-1：中小型单体项目（最常用）" class="headerlink" title="场景 1：中小型单体项目（最常用）"></a>场景 1：中小型单体项目（最常用）</h3><p>根目录放置唯一的 AGENTS.md 文件，覆盖项目全量核心规则，适配 90% 以上的单体项目。</p><p><strong>关键原则</strong>：所有规则必须<strong>量化</strong>，而非模糊表述。</p><table><thead><tr><th>模糊表述 ❌</th><th>量化表述 ✅</th></tr></thead><tbody><tr><td>“编写高质量代码”</td><td>“函数行数不超过 50 行”</td></tr><tr><td>“代码要简洁”</td><td>“圈复杂度上限为 10”</td></tr><tr><td>“注意代码风格”</td><td>“注释率不低于 20%”</td></tr></tbody></table><p><strong>迭代闭环</strong>：每次 AI 出现错误、踩坑后，将对应约束规则补充到 AGENTS.md 中，持续优化。</p><hr><h3 id="场景-2：大型-Monorepo-多模块项目"><a href="#场景-2：大型-Monorepo-多模块项目" class="headerlink" title="场景 2：大型 Monorepo &#x2F; 多模块项目"></a>场景 2：大型 Monorepo &#x2F; 多模块项目</h3><p>采用”全局 + 局部”的分层嵌套式管理，实现细粒度管控。</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br></pre></td><td class="code"><pre><span class="line">monorepo-project/</span><br><span class="line">├── AGENTS.md                    # 根目录全局规则：安全合规底线、通用工具链规范</span><br><span class="line">├── apps/</span><br><span class="line">│   ├── web-admin/</span><br><span class="line">│   │   └── AGENTS.md           # 管理后台专属规则（优先级 &gt; 根目录）</span><br><span class="line">│   └── h5-mobile/</span><br><span class="line">│       └── AGENTS.md           # H5 移动端专属规则（优先级 &gt; 根目录）</span><br><span class="line">├── packages/</span><br><span class="line">│   ├── components/</span><br><span class="line">│   │   └── AGENTS.md           # 公共组件库规则</span><br><span class="line">│   └── utils/</span><br><span class="line">│       └── AGENTS.md           # 工具库规则</span><br><span class="line">└── docs/</span><br><span class="line">    └── AGENTS.md               # 文档目录专属规则</span><br></pre></td></tr></table></figure><blockquote><p><strong>行业案例</strong>：OpenAI 主仓库使用 <strong>88 个 AGENTS.md 文件</strong>，分别对应不同业务模块，实现极致精准的 AI 行为控制。</p></blockquote><hr><h3 id="场景-3：团队协作"><a href="#场景-3：团队协作" class="headerlink" title="场景 3：团队协作"></a>场景 3：团队协作</h3><p>将 AGENTS.md 纳入项目标准化流程，作为代码仓库的必备文件，由团队共同维护。</p><ul><li><strong>统一标准</strong>：所有开发者使用 AI 时，都遵循统一的项目规则，避免个人 Prompt 带来的输出差异</li><li><strong>新人入职</strong>：新成员可通过 AGENTS.md 快速让 AI 适配项目，降低项目熟悉成本</li></ul><hr><h3 id="场景-4：安全与权限"><a href="#场景-4：安全与权限" class="headerlink" title="场景 4：安全与权限"></a>场景 4：安全与权限</h3><ul><li><strong>写保护机制</strong>：所有兼容工具均支持 AGENTS.md 写保护，AI 无法擅自修改核心规则</li><li><strong>三级权限边界</strong>：</li></ul><table><thead><tr><th>权限等级</th><th>行为</th><th>示例</th></tr></thead><tbody><tr><td>✅ 可直接执行</td><td>读取代码、执行标准命令</td><td>读取 <code>src/</code>、执行 <code>pnpm dev</code></td></tr><tr><td>⚠️ 需用户确认</td><td>修改配置文件、核心架构</td><td>修改 <code>.eslintrc.js</code></td></tr><tr><td>❌ 绝对禁止</td><td>高危系统命令、未经审核依赖</td><td><code>rm -rf /</code>、引入未审核的 npm 包</td></tr></tbody></table><hr><h2 id="六、为什么选择-AGENTS-md"><a href="#六、为什么选择-AGENTS-md" class="headerlink" title="六、为什么选择 AGENTS.md"></a>六、为什么选择 AGENTS.md</h2><table><thead><tr><th>#</th><th>优势</th><th>说明</th></tr></thead><tbody><tr><td>1</td><td><strong>极致降本提效</strong></td><td>一次编写，全工具兼容，减少重复上下文投喂</td></tr><tr><td>2</td><td><strong>标准化 AI 开发流程</strong></td><td>统一项目内 AI 的行为规范，降低 Code Review 和返工成本</td></tr><tr><td>3</td><td><strong>零门槛快速接入</strong></td><td>纯 Markdown 格式，只需新增一个文件即可接入所有兼容工具</td></tr><tr><td>4</td><td><strong>全场景适配</strong></td><td>从个人项目到超大型企业级 Monorepo 都能完美适配</td></tr><tr><td>5</td><td><strong>中立开源无厂商锁定</strong></td><td>Linux 基金会 AAIF 中立治理，不被单一厂商专有格式绑定</td></tr><tr><td>6</td><td><strong>安全可控</strong></td><td>自带写保护机制 + 权限边界定义，精准管控 AI 操作范围</td></tr></tbody></table><hr><h2 id="七、完整编写模板（可直接复用）"><a href="#七、完整编写模板（可直接复用）" class="headerlink" title="七、完整编写模板（可直接复用）"></a>七、完整编写模板（可直接复用）</h2><p>以下模板适用于大多数项目，可根据实际技术栈调整：</p><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># AGENTS.md - [项目名称] AI 编码代理操作手册</span></span><br><span class="line"></span><br><span class="line"><span class="section">## 1. 项目核心概览</span></span><br><span class="line"><span class="bullet">-</span> <span class="strong">**项目类型**</span>：[例如：企业级中后台管理系统 / 前端组件库 / 后端微服务框架]</span><br><span class="line"><span class="bullet">-</span> <span class="strong">**核心功能**</span>：[一句话说明项目的核心用途与业务目标]</span><br><span class="line"><span class="bullet">-</span> <span class="strong">**技术栈**</span>：[例如：Vue3 + TypeScript + Vite + Pinia / Spring Boot 3 + Java 17]</span><br><span class="line"><span class="bullet">-</span> <span class="strong">**架构说明**</span>：[例如：前后端分离架构 / Monorepo 多包架构]</span><br><span class="line"><span class="bullet">-</span> <span class="strong">**项目底线约束**</span>：[例如：必须兼容 Node.js 18+ / 禁止引入未经安全审核的依赖]</span><br><span class="line"></span><br><span class="line"><span class="section">## 2. 项目结构与核心目录说明</span></span><br></pre></td></tr></table></figure><p>[项目根目录]&#x2F;<br>├── AGENTS.md                    # 本文件，AI代理全局规则（禁止AI擅自修改）<br>├── README.md                    # 项目人类可读说明文档<br>├── src&#x2F;                         # 核心源码目录<br>│   ├── api&#x2F;                     # 接口请求封装<br>│   ├── components&#x2F;              # 公共通用组件<br>│   ├── pages&#x2F;                   # 业务页面代码<br>│   ├── utils&#x2F;                   # 通用工具函数<br>│   └── assets&#x2F;                  # 静态资源文件<br>├── tests&#x2F;                       # 单元测试&#x2F;集成测试目录<br>└── scripts&#x2F;                     # 构建和部署脚本</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br></pre></td><td class="code"><pre><span class="line">- **目录读写权限**：[例如：仅可直接修改 src/pages/、src/components/，修改配置文件需用户手动确认]</span><br><span class="line"></span><br><span class="line">## 3. 标准开发与执行命令</span><br><span class="line">&gt; 所有操作必须使用以下指定命令，禁止使用其他替代命令</span><br><span class="line"></span><br><span class="line">- **安装依赖**：`[例如：pnpm install]`</span><br><span class="line">- **本地启动开发服务**：`[例如：pnpm dev]`</span><br><span class="line">- **生产环境构建**：`[例如：pnpm build]`</span><br><span class="line">- **运行全量单元测试**：`[例如：pnpm test]`</span><br><span class="line">- **运行代码格式检查**：`[例如：pnpm lint]`</span><br><span class="line">- **代码自动格式化**：`[例如：pnpm format]`</span><br><span class="line">- **其他核心命令**：[例如：pnpm db:migrate 数据库迁移]</span><br><span class="line"></span><br><span class="line">## 4. 代码规范与编写约束</span><br><span class="line">- **语言与语法**：[例如：强制使用 TypeScript 严格模式，禁用 any 类型]</span><br><span class="line">- **命名约定**：[例如：组件使用 PascalCase，函数/变量使用 camelCase]</span><br><span class="line">- **代码质量约束**：[例如：单个函数行数不超过 50 行；圈复杂度上限为 10]</span><br><span class="line">- **异常处理规范**：[例如：所有异步请求必须有 try/catch 异常捕获]</span><br><span class="line"></span><br><span class="line">## 5. Git 与提交规范</span><br><span class="line">- **分支管理规则**：[例如：feature/xxx 开发分支，bugfix/xxx 修复分支，禁止直接提交到 main 分支]</span><br><span class="line">- **Commit 提交格式**：[例如：`&lt;type&gt;(&lt;scope&gt;): &lt;subject&gt;`，type 可选值：feat/fix/docs/style/refactor/test/chore]</span><br><span class="line">- **PR/MR 规则**：[例如：提交 PR 前必须完成全量测试与 Lint 检查]</span><br><span class="line"></span><br><span class="line">## 6. AI 代理行为准则与权限边界</span><br><span class="line">### 核心工作原则</span><br><span class="line">1. 所有操作必须严格遵循本文件定义的规则，优先适配本项目的专属约定</span><br><span class="line">2. 代码编写必须先理解现有项目的架构与风格，保持与现有代码的一致性</span><br><span class="line">3. 执行任何修改前，必须先读取相关文件，充分理解上下文，禁止凭空生成代码</span><br><span class="line">4. 完成代码编写后，必须先执行 Lint 检查与相关测试，确保无报错、无警告，方可提交</span><br><span class="line"></span><br><span class="line">### 权限边界</span><br><span class="line">- ✅ 可直接执行：读取项目内所有代码文件；执行本文件定义的标准开发命令</span><br><span class="line">- ⚠️ 需用户确认后执行：修改项目配置文件；修改核心架构代码</span><br><span class="line">- ❌ 绝对禁止执行：擅自修改/删除本 AGENTS.md 文件；执行高危系统命令</span><br><span class="line"></span><br><span class="line">## 7. 异常处理与兜底规则</span><br><span class="line">- 当遇到本文件未定义的规则时，优先参考项目内已有的代码风格与约定</span><br><span class="line">- 当执行命令报错时，优先查看项目内的错误日志与已有解决方案，无法解决时及时向用户反馈</span><br><span class="line">- 当用户需求与本文件规则冲突时，优先向用户确认，以用户的明确指令为准</span><br></pre></td></tr></table></figure><hr><h2 id="八、项目结构全景图"><a href="#八、项目结构全景图" class="headerlink" title="八、项目结构全景图"></a>八、项目结构全景图</h2><h3 id="单项目结构（中小型项目）"><a href="#单项目结构（中小型项目）" class="headerlink" title="单项目结构（中小型项目）"></a>单项目结构（中小型项目）</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line">your-project/</span><br><span class="line">├── AGENTS.md          # 根目录主文件（推荐全大写命名，唯一主入口）</span><br><span class="line">├── AGENT.md           # 备用兼容文件，单数形式，优先级低于 AGENTS.md</span><br><span class="line">├── README.md          # 面向人类的项目说明文档</span><br><span class="line">├── src/               # 项目核心源码</span><br><span class="line">├── tests/             # 测试用例</span><br><span class="line">└── package.json       # 项目依赖配置</span><br></pre></td></tr></table></figure><h3 id="Monorepo-结构（大型项目）"><a href="#Monorepo-结构（大型项目）" class="headerlink" title="Monorepo 结构（大型项目）"></a>Monorepo 结构（大型项目）</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br></pre></td><td class="code"><pre><span class="line">monorepo-project/</span><br><span class="line">├── AGENTS.md                    # 根目录全局规则：组织级通用规范、安全合规底线</span><br><span class="line">├── README.md                    # 项目整体说明</span><br><span class="line">├── package.json                 # 全局依赖配置</span><br><span class="line">├── pnpm-workspace.yaml          # monorepo 工作空间配置</span><br><span class="line">├── apps/</span><br><span class="line">│   ├── web-admin/</span><br><span class="line">│   │   └── AGENTS.md           # 管理后台子项目专属规则（优先级 &gt; 根目录）</span><br><span class="line">│   └── h5-mobile/</span><br><span class="line">│       └── AGENTS.md           # H5 移动端子项目专属规则（优先级 &gt; 根目录）</span><br><span class="line">├── packages/</span><br><span class="line">│   ├── components/</span><br><span class="line">│   │   └── AGENTS.md           # 公共组件库专属规则</span><br><span class="line">│   └── utils/</span><br><span class="line">│       └── AGENTS.md           # 工具库专属规则</span><br><span class="line">└── docs/</span><br><span class="line">    └── AGENTS.md               # 文档目录专属规则</span><br></pre></td></tr></table></figure><hr><h2 id="九、价值总结"><a href="#九、价值总结" class="headerlink" title="九、价值总结"></a>九、价值总结</h2><p>AGENTS.md 的本质是<strong>用最小的上下文成本，让 AI 获得最大的项目理解</strong>。</p><table><thead><tr><th>维度</th><th>价值</th></tr></thead><tbody><tr><td><strong>对 AI</strong></td><td>提供精准上下文，让 AI 从”通用助手”变身”深度适配项目的专属开发专家”</td></tr><tr><td><strong>对团队</strong></td><td>沉淀隐性知识（编码规范、架构约束、开发流程），形成标准化的 AI 辅助开发流程</td></tr><tr><td><strong>对项目</strong></td><td>构建”打开即理解、改完即验证”的高效开发反馈回路</td></tr></tbody></table><blockquote><p>AGENTS.md 不是一个简单的配置文件，而是 <strong>AI 编程时代的项目协作事实标准</strong>，是跨厂商、跨工具的互操作性协议，是把开发者从重复人机沟通中解放出来的核心载体。</p></blockquote>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/06/agents-md-practice-guide/</id>
    <link href="https://iyangjialin.github.io/2026/05/06/agents-md-practice-guide/"/>
    <published>2026-05-06T06:40:00.000Z</published>
    <summary>
      <![CDATA[<blockquote>
<p><strong>“README.md 是给人类开发者看的项目介绍，而 AGENTS.md 是专门给 AI 读的、项目专属的’宪法’。”</strong><br>AGENTS.md 是 AI 编码时代的项目级 System Prompt，目前已被超 6 万个开源项目采用，几乎所有主流 AI 编码工具均原生支持。</p>
</blockquote>
<p>本文系统介绍 AGENTS.md 的<strong>定义、核心理念、五大实践方案、完整编写模板与项目结构</strong>，帮助团队快速落地”一份文件，全工具兼容”的 AI 编码规范。</p>]]>
    </summary>
    <title>AGENTS.md 实践指南：让 AI 编码代理从&quot;通用助手&quot;变身&quot;项目专属开发专家&quot;</title>
    <updated>2026-05-06T06:44:35.342Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="工程实践" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E5%B7%A5%E7%A8%8B%E5%AE%9E%E8%B7%B5/"/>
    <category term="Claude Code" scheme="https://iyangjialin.github.io/tags/Claude-Code/"/>
    <category term="AI编码" scheme="https://iyangjialin.github.io/tags/AI%E7%BC%96%E7%A0%81/"/>
    <category term="Cursor" scheme="https://iyangjialin.github.io/tags/Cursor/"/>
    <category term="开源项目" scheme="https://iyangjialin.github.io/tags/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE/"/>
    <category term="OpenSpec" scheme="https://iyangjialin.github.io/tags/OpenSpec/"/>
    <category term="规范驱动" scheme="https://iyangjialin.github.io/tags/%E8%A7%84%E8%8C%83%E9%A9%B1%E5%8A%A8/"/>
    <category term="项目管理" scheme="https://iyangjialin.github.io/tags/%E9%A1%B9%E7%9B%AE%E7%AE%A1%E7%90%86/"/>
    <content>
      <![CDATA[<blockquote><p><strong>“The most loved spec framework.”</strong><br>GitHub: <a href="https://github.com/Fission-AI/OpenSpec">Fission-AI&#x2F;OpenSpec</a> · 45.4k ⭐ · MIT License</p></blockquote><hr><h2 id="目录"><a href="#目录" class="headerlink" title="目录"></a>目录</h2><ol><li><a href="#%E4%BB%80%E4%B9%88%E6%98%AF-openspec">什么是 OpenSpec</a></li><li><a href="#%E6%A0%B8%E5%BF%83%E4%BB%B7%E5%80%BC">核心价值</a></li><li><a href="#%E8%AE%BE%E8%AE%A1%E5%93%B2%E5%AD%A6">设计哲学</a></li><li><a href="#%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86">工作原理</a></li><li><a href="#%E5%AE%8C%E6%95%B4%E5%B7%A5%E4%BD%9C%E6%B5%81">完整工作流</a></li><li><a href="#%E6%8A%80%E6%9C%AF%E6%9E%B6%E6%9E%84%E5%88%86%E5%B1%82">技术架构分层</a></li><li><a href="#%E6%A0%87%E5%87%86%E9%A1%B9%E7%9B%AE%E7%BB%93%E6%9E%84%E4%B8%8E%E6%96%87%E4%BB%B6%E8%AF%B4%E6%98%8E">标准项目结构与文件说明</a></li><li><a href="#%E5%85%A5%E9%97%A8%E6%8C%87%E5%8D%97">入门指南</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E6%A1%88%E4%BE%8B">实践案例</a></li><li><a href="#%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98">常见问题</a></li></ol><span id="more"></span><hr><h2 id="一、什么是-OpenSpec"><a href="#一、什么是-OpenSpec" class="headerlink" title="一、什么是 OpenSpec"></a>一、什么是 OpenSpec</h2><p>OpenSpec 是一个<strong>轻量级规范驱动开发框架</strong>（Spec-Driven Development Framework），旨在让人类与 AI 编码助手在写代码之前，先就「要做什么」达成一致。</p><p>它不是一个项目管理工具，不是一个文档生成器，而是一个<strong>结构化的「共识层」</strong>——在模糊的想法和混乱的代码之间，建立起清晰的行为契约。</p><h3 id="📖-一句话定义"><a href="#📖-一句话定义" class="headerlink" title="📖 一句话定义"></a>📖 一句话定义</h3><blockquote><p><strong>OpenSpec &#x3D; 在 AI 写代码之前，人类和 AI 一起填写「要做什么」的规格说明，然后按规格交付。</strong></p></blockquote><h3 id="⚡-与传统方案的本质区别"><a href="#⚡-与传统方案的本质区别" class="headerlink" title="⚡ 与传统方案的本质区别"></a>⚡ 与传统方案的本质区别</h3><table><thead><tr><th>对比维度</th><th>传统方案</th><th>OpenSpec</th></tr></thead><tbody><tr><td>需求载体</td><td>口头沟通、邮件、Issue</td><td>结构化 Artifact 文件</td></tr><tr><td>变更追踪</td><td>Git 历史推演</td><td>Delta Spec 增量描述</td></tr><tr><td>AI 协作</td><td>每次都是新对话，无记忆</td><td>规格文件作为永久上下文</td></tr><tr><td>灵活度</td><td>瀑布式分阶段</td><td>流体式，随时可迭代</td></tr></tbody></table><hr><h2 id="二、核心价值"><a href="#二、核心价值" class="headerlink" title="二、核心价值"></a>二、核心价值</h2><h3 id="2-1-对人类（开发者-产品负责人）"><a href="#2-1-对人类（开发者-产品负责人）" class="headerlink" title="2.1 对人类（开发者&#x2F;产品负责人）"></a>2.1 对人类（开发者&#x2F;产品负责人）</h3><ul><li><strong>减少返工</strong>：AI 不会跑偏，因为规格先行</li><li><strong>可追溯</strong>：每个代码变更都有对应的 <code>proposal → specs → design → tasks</code> 链路</li><li><strong>灵活变更</strong>：随时回头改规格，代码跟着走</li></ul><h3 id="2-2-对-AI（编码助手）"><a href="#2-2-对-AI（编码助手）" class="headerlink" title="2.2 对 AI（编码助手）"></a>2.2 对 AI（编码助手）</h3><ul><li><strong>有据可依</strong>：不再靠「猜」，规格文档就是行动指南</li><li><strong>上下文稳定</strong>：文件比聊天历史更持久</li><li><strong>边界清晰</strong>：<code>tasks.md</code> 的 Checkbox 是明确的完成标准</li></ul><h3 id="2-3-对团队"><a href="#2-3-对团队" class="headerlink" title="2.3 对团队"></a>2.3 对团队</h3><ul><li><strong>多人协作</strong>：规格是共识的基础，Code Review 有据可查</li><li><strong>跨工具集成</strong>：支持 25+ AI 工具（Claude Code、Cursor、Windsurf、Cline 等）</li><li><strong>企业级扩展</strong>：从个人项目到跨仓库企业项目均可</li></ul><hr><h2 id="三、设计哲学"><a href="#三、设计哲学" class="headerlink" title="三、设计哲学"></a>三、设计哲学</h2><p>OpenSpec 的设计哲学浓缩为五句话：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line">fluid not rigid          # 流体式，而非僵化分阶段</span><br><span class="line">iterative not waterfall  # 迭代式，而非瀑布式</span><br><span class="line">easy not complex         # 简洁化，而非复杂化</span><br><span class="line">built for brownfield     # 支持存量项目，而不仅是新项目</span><br><span class="line">not just greenfield</span><br><span class="line">scalable from personal   # 从个人项目到企业级均可</span><br><span class="line">projects to enterprises</span><br></pre></td></tr></table></figure><h3 id="3-1-Fluid-Not-Rigid（流体式）"><a href="#3-1-Fluid-Not-Rigid（流体式）" class="headerlink" title="3.1 Fluid Not Rigid（流体式）"></a>3.1 Fluid Not Rigid（流体式）</h3><p>传统规范框架让你经历：规划阶段 → 实现阶段 → 完成。这是一个锁死的流程。</p><p>OpenSpec 允许你以任何顺序创建产物（Artifact）：可以从 <code>proposal</code> 开始，也可以从 <code>tasks</code> 开始。依赖关系只是指引，不是限制。</p><h3 id="3-2-Iterative-Not-Waterfall（迭代式）"><a href="#3-2-Iterative-Not-Waterfall（迭代式）" class="headerlink" title="3.2 Iterative Not Waterfall（迭代式）"></a>3.2 Iterative Not Waterfall（迭代式）</h3><p>需求会变，理解会深化。一开始看起来正确的方案，在看到代码库后可能不成立。</p><p>OpenSpec 拥抱这个现实——<strong>随时可以回去更新任何一个 Artifact</strong>，不需要「规划阶段」的完美才开始。</p><h3 id="3-3-Easy-Not-Complex（简洁化）"><a href="#3-3-Easy-Not-Complex（简洁化）" class="headerlink" title="3.3 Easy Not Complex（简洁化）"></a>3.3 Easy Not Complex（简洁化）</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 安装</span></span><br><span class="line">npm install -g @fission-ai/openspec@latest</span><br><span class="line"></span><br><span class="line"><span class="comment"># 初始化（几秒钟完成）</span></span><br><span class="line">openspec init</span><br><span class="line"></span><br><span class="line"><span class="comment"># 开始工作</span></span><br><span class="line">/opsx:propose your-idea</span><br></pre></td></tr></table></figure><p>无需繁重的格式或仪式。</p><h3 id="3-4-Brownfield-First（存量优先）"><a href="#3-4-Brownfield-First（存量优先）" class="headerlink" title="3.4 Brownfield-First（存量优先）"></a>3.4 Brownfield-First（存量优先）</h3><p>大多数软件工作不是从零开始，而是在既有系统上修改。OpenSpec 的 <strong>Delta Spec 机制</strong>使得描述「对现有行为的变更」变得自然，而不是重新描述整个系统。</p><h3 id="3-5-Scalable（可扩展）"><a href="#3-5-Scalable（可扩展）" class="headerlink" title="3.5 Scalable（可扩展）"></a>3.5 Scalable（可扩展）</h3><table><thead><tr><th>规模</th><th>方案</th></tr></thead><tbody><tr><td>个人项目</td><td>一个人用，<code>openspec/</code> 目录足够</td></tr><tr><td>团队协作</td><td>共享 <code>openspec/</code> 目录，规格即文档</td></tr><tr><td>跨仓库企业</td><td>OpenSpec Workspace 支持跨多个仓库的协调规划</td></tr></tbody></table><hr><h2 id="四、工作原理"><a href="#四、工作原理" class="headerlink" title="四、工作原理"></a>四、工作原理</h2><h3 id="4-1-核心概念"><a href="#4-1-核心概念" class="headerlink" title="4.1 核心概念"></a>4.1 核心概念</h3><p>OpenSpec 有三个核心概念：</p><ol><li><strong>Specs（规格）</strong>：系统的行为真相源（Source of Truth），描述「系统现在是如何运作的」</li><li><strong>Changes（变更）</strong>：提议的修改，每个变更有独立文件夹，包含完整的规划产物</li><li><strong>Delta Specs（增量规格）</strong>：描述相对于现有规格的「增&#x2F;改&#x2F;删」，而非重写整个规格</li></ol><h3 id="4-2-Artifact-体系"><a href="#4-2-Artifact-体系" class="headerlink" title="4.2 Artifact 体系"></a>4.2 Artifact 体系</h3><p>每个 Change 文件夹中包含四类 Artifact，它们之间有依赖关系但不是严格阶段门：</p><table><thead><tr><th>Artifact</th><th>作用</th><th>类比</th></tr></thead><tbody><tr><td><code>proposal.md</code></td><td><strong>Why &amp; What</strong> — 动机、范围、思路</td><td>战略层</td></tr><tr><td><code>specs/</code></td><td><strong>Requirements</strong> — ADDED&#x2F;MODIFIED&#x2F;REMOVED 需求</td><td>需求层</td></tr><tr><td><code>design.md</code></td><td><strong>How</strong> — 技术方案、架构决策</td><td>设计层</td></tr><tr><td><code>tasks.md</code></td><td><strong>Checklist</strong> — 可执行的任务清单</td><td>执行层</td></tr></tbody></table><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line">proposal ──► specs ──► design ──► tasks ──► implement</span><br><span class="line">   ▲           ▲          ▲                    │</span><br><span class="line">   └───────────┴──────────┴────────────────────┘</span><br><span class="line">            update as you learn</span><br></pre></td></tr></table></figure><h3 id="4-3-Delta-Spec-的格式"><a href="#4-3-Delta-Spec-的格式" class="headerlink" title="4.3 Delta Spec 的格式"></a>4.3 Delta Spec 的格式</h3><p>这是 OpenSpec 最核心的创新。每个 Change 的 <code>specs/</code> 目录不写完整的规格，而是写<strong>增量</strong>：</p><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># Delta for Auth</span></span><br><span class="line"></span><br><span class="line"><span class="section">## ADDED Requirements</span></span><br><span class="line"></span><br><span class="line"><span class="section">### Requirement: Two-Factor Authentication</span></span><br><span class="line">系统必须在登录时要求第二个认证因子。</span><br><span class="line"></span><br><span class="line"><span class="section">#### Scenario: OTP required</span></span><br><span class="line"><span class="bullet">-</span> GIVEN 已启用2FA的用户</span><br><span class="line"><span class="bullet">-</span> WHEN 用户提交有效凭证</span><br><span class="line"><span class="bullet">-</span> THEN 展示 OTP 挑战</span><br><span class="line"></span><br><span class="line"><span class="section">## MODIFIED Requirements</span></span><br><span class="line"></span><br><span class="line"><span class="section">### Requirement: Session Timeout</span></span><br><span class="line">会话在30分钟不活动后失效。（原为60分钟）</span><br><span class="line"></span><br><span class="line"><span class="section">## REMOVED Requirements</span></span><br><span class="line"></span><br><span class="line"><span class="section">### Requirement: Remember Me</span></span><br><span class="line">（已被2FA替代，已废弃）</span><br></pre></td></tr></table></figure><p>当 Change 被 Archive 时：</p><ul><li><strong>ADDED</strong> → 追加到主规格</li><li><strong>MODIFIED</strong> → 替换现有版本</li><li><strong>REMOVED</strong> → 从主规格中删除</li></ul><p>这样主规格始终是「当前系统行为」的完整描述，而 Change 只是「我想改什么」。</p><h3 id="4-4-斜杠命令体系"><a href="#4-4-斜杠命令体系" class="headerlink" title="4.4 斜杠命令体系"></a>4.4 斜杠命令体系</h3><p>OpenSpec 通过 AI 助手的斜杠命令（Slash Commands）来驱动：</p><table><thead><tr><th>命令</th><th>作用</th></tr></thead><tbody><tr><td><code>/opsx:propose</code></td><td>一键创建完整变更（含所有 Artifact）</td></tr><tr><td><code>/opsx:explore</code></td><td>探索性研究，不创建产物</td></tr><tr><td><code>/opsx:apply</code></td><td>按 tasks.md 执行实现</td></tr><tr><td><code>/opsx:sync</code></td><td>将 Delta Spec 合并到主规格</td></tr><tr><td><code>/opsx:archive</code></td><td>归档完成的变更</td></tr><tr><td><code>/opsx:new</code></td><td>创建空变更骨架（Expanded 模式）</td></tr><tr><td><code>/opsx:continue</code></td><td>按依赖链创建下一个 Artifact（Expanded 模式）</td></tr><tr><td><code>/opsx:ff</code></td><td>快速创建所有 Artifact（Expanded 模式）</td></tr><tr><td><code>/opsx:verify</code></td><td>验证实现是否符合规格（Expanded 模式）</td></tr></tbody></table><hr><h2 id="五、完整工作流"><a href="#五、完整工作流" class="headerlink" title="五、完整工作流"></a>五、完整工作流</h2><h3 id="5-1-默认快速路径（Core-Profile）"><a href="#5-1-默认快速路径（Core-Profile）" class="headerlink" title="5.1 默认快速路径（Core Profile）"></a>5.1 默认快速路径（Core Profile）</h3><p>新安装默认启用 <code>core</code> profile，命令最简：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">/opsx:propose ──► /opsx:apply ──► /opsx:sync ──► /opsx:archive</span><br></pre></td></tr></table></figure><p><strong>Step-by-Step 示例：</strong></p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br></pre></td><td class="code"><pre><span class="line">你: /opsx:propose add-dark-mode</span><br><span class="line"></span><br><span class="line">AI:  Created openspec/changes/add-dark-mode/</span><br><span class="line">     ✓ proposal.md — why we&#x27;re doing this, what&#x27;s changing</span><br><span class="line">     ✓ specs/       — requirements and scenarios</span><br><span class="line">     ✓ design.md    — technical approach</span><br><span class="line">     ✓ tasks.md     — implementation checklist</span><br><span class="line">     Ready for implementation!</span><br><span class="line"></span><br><span class="line">你: /opsx:apply</span><br><span class="line"></span><br><span class="line">AI:  Implementing tasks...</span><br><span class="line">     ✓ 1.1 Add theme context provider</span><br><span class="line">     ✓ 1.2 Create toggle component</span><br><span class="line">     ✓ 2.1 Add CSS variables</span><br><span class="line">     ✓ 2.2 Wire up localStorage</span><br><span class="line">     All tasks complete!</span><br><span class="line"></span><br><span class="line">你: /opsx:archive</span><br><span class="line"></span><br><span class="line">AI:  Archived to openspec/changes/archive/2025-01-23-add-dark-mode/</span><br><span class="line">     Specs updated. Ready for the next feature.</span><br></pre></td></tr></table></figure><h3 id="5-2-扩展工作流（Expanded-Profile）"><a href="#5-2-扩展工作流（Expanded-Profile）" class="headerlink" title="5.2 扩展工作流（Expanded Profile）"></a>5.2 扩展工作流（Expanded Profile）</h3><p>启用方式：</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">openspec config profile   <span class="comment"># 选择 workflows</span></span><br><span class="line">openspec update           <span class="comment"># 更新 AI 指令</span></span><br></pre></td></tr></table></figure><p>扩展模式命令：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">/opsx:new ──► /opsx:ff or /opsx:continue ──► /opsx:apply ──► /opsx:verify ──► /opsx:archive</span><br></pre></td></tr></table></figure><p><strong>适合场景：</strong></p><ul><li>复杂功能需要逐步审视每个 Artifact</li><li>需要在 Artifact 之间迭代调整</li></ul><h3 id="5-3-探索式工作流"><a href="#5-3-探索式工作流" class="headerlink" title="5.3 探索式工作流"></a>5.3 探索式工作流</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">/opsx:explore ──► /opsx:new ──► /opsx:continue ──► ... ──► /opsx:apply</span><br></pre></td></tr></table></figure><p>适合需求不明确时先研究，再转正式变更。</p><h3 id="5-4-并行变更工作流"><a href="#5-4-并行变更工作流" class="headerlink" title="5.4 并行变更工作流"></a>5.4 并行变更工作流</h3><p>可以同时推进多个 Change：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line">Change A: /opsx:new ──► /opsx:ff ──► /opsx:apply（在推进中）</span><br><span class="line">                                        │</span><br><span class="line">                                   切换上下文</span><br><span class="line">                                        │</span><br><span class="line">Change B: /opsx:new ──► /opsx:ff ──► /opsx:apply</span><br></pre></td></tr></table></figure><p>完成后可用 <code>/opsx:bulk-archive</code> 批量归档。</p><hr><h2 id="六、技术架构分层"><a href="#六、技术架构分层" class="headerlink" title="六、技术架构分层"></a>六、技术架构分层</h2><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br></pre></td><td class="code"><pre><span class="line">┌─────────────────────────────────────────────────────┐</span><br><span class="line">│                 AI Coding Assistant                 │</span><br><span class="line">│         (Claude Code, Cursor, Windsurf, etc.)     │</span><br><span class="line">│                                                     │</span><br><span class="line">│   ┌─────────────────────────────────────────────┐   │</span><br><span class="line">│   │         OPSX Slash Command Layer            │   │</span><br><span class="line">│   │  /propose /apply /archive /verify /sync    │   │</span><br><span class="line">│   └─────────────────────────────────────────────┘   │</span><br><span class="line">└──────────────────────┬──────────────────────────────┘</span><br><span class="line">                       │ Slash Commands</span><br><span class="line">┌──────────────────────▼──────────────────────────────┐</span><br><span class="line">│              OpenSpec CLI (Node.js)                 │</span><br><span class="line">│                                                      │</span><br><span class="line">│  ┌──────────┐  ┌───────────┐  ┌───────────────┐    │</span><br><span class="line">│  │   Init   │  │  Config   │  │   Artifact    │    │</span><br><span class="line">│  │  Engine  │  │  Manager  │  │   Generator   │    │</span><br><span class="line">│  └──────────┘  └───────────┘  └───────────────┘    │</span><br><span class="line">│                                                      │</span><br><span class="line">│  ┌──────────┐  ┌───────────┐  ┌───────────────┐    │</span><br><span class="line">│  │  Delta   │  │   Sync    │  │   Workspace   │    │</span><br><span class="line">│  │   Merge  │  │  Engine   │  │    Manager    │    │</span><br><span class="line">│  └──────────┘  └───────────┘  └───────────────┘    │</span><br><span class="line">└──────────────────────┬──────────────────────────────┘</span><br><span class="line">                       │ File System I/O</span><br><span class="line">┌──────────────────────▼──────────────────────────────┐</span><br><span class="line">│                 Project Files                        │</span><br><span class="line">│                                                      │</span><br><span class="line">│  ┌─────────────────┐       ┌─────────────────────┐ │</span><br><span class="line">│  │   openspec/     │       │   Your Source Code  │ │</span><br><span class="line">│  │   ├── specs/    │       │       (任意项目)      │ │</span><br><span class="line">│  │   ├── changes/  │       └─────────────────────┘ │</span><br><span class="line">│  │   └── config.yaml      │                        │</span><br><span class="line">│  └─────────────────┘       │                        │</span><br><span class="line">│                    Delta Specs ──► Merge ──► Specs   │</span><br><span class="line">└─────────────────────────────────────────────────────┘</span><br></pre></td></tr></table></figure><h3 id="6-1-CLI-层（Node-js）"><a href="#6-1-CLI-层（Node-js）" class="headerlink" title="6.1 CLI 层（Node.js）"></a>6.1 CLI 层（Node.js）</h3><ul><li><strong>全局安装</strong>：<code>npm install -g @fission-ai/openspec@latest</code></li><li><strong>依赖</strong>：<code>Node.js &gt;= 20.19.0</code></li><li><strong>包管理</strong>：支持 npm、pnpm、yarn、bun、Nix</li></ul><h3 id="6-2-Schema-层"><a href="#6-2-Schema-层" class="headerlink" title="6.2 Schema 层"></a>6.2 Schema 层</h3><p>OpenSpec 的工作流由 <strong>Schema</strong> 驱动。默认 Schema 是 <code>spec-driven</code>，定义了 Artifact 的依赖图和生成顺序。</p><p>用户可以自定义 Schema 来创建自己的 Artifact 序列。社区 Schema 发布在独立的仓库中。</p><h3 id="6-3-AI-集成层"><a href="#6-3-AI-集成层" class="headerlink" title="6.3 AI 集成层"></a>6.3 AI 集成层</h3><p>AI 助手通过 <code>AGENTS.md</code>（由 <code>openspec init</code> 生成）中的指令来理解 OpenSpec 命令。运行 <code>openspec update</code> 会重新生成这些指令以保持同步。</p><h3 id="6-4-Workspace-层（企业-跨仓库）"><a href="#6-4-Workspace-层（企业-跨仓库）" class="headerlink" title="6.4 Workspace 层（企业&#x2F;跨仓库）"></a>6.4 Workspace 层（企业&#x2F;跨仓库）</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line">workspace-folder/</span><br><span class="line">├── changes/                          # 跨仓库协调规划</span><br><span class="line">└── .openspec-workspace/</span><br><span class="line">    ├── workspace.yaml   # 共享标识 + 链接名（可移植）</span><br><span class="line">    └── local.yaml       # 本机路径映射（不含于共享状态）</span><br></pre></td></tr></table></figure><p>支持的命令：</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line">openspec workspace setup</span><br><span class="line">openspec workspace list</span><br><span class="line">openspec workspace <span class="built_in">link</span> &lt;name&gt; &lt;path&gt;</span><br><span class="line">openspec workspace doctor</span><br></pre></td></tr></table></figure><hr><h2 id="七、标准项目结构与文件说明"><a href="#七、标准项目结构与文件说明" class="headerlink" title="七、标准项目结构与文件说明"></a>七、标准项目结构与文件说明</h2><h3 id="7-1-初始化后的项目结构"><a href="#7-1-初始化后的项目结构" class="headerlink" title="7.1 初始化后的项目结构"></a>7.1 初始化后的项目结构</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br></pre></td><td class="code"><pre><span class="line">project-root/</span><br><span class="line">├── openspec/</span><br><span class="line">│   ├── specs/                    # ⭐ 系统行为真相源</span><br><span class="line">│   │   └── &lt;domain&gt;/</span><br><span class="line">│   │       └── spec.md</span><br><span class="line">│   ├── changes/                 # 提议的变更</span><br><span class="line">│   │   └── &lt;change-name&gt;/</span><br><span class="line">│   │       ├── proposal.md</span><br><span class="line">│   │       ├── design.md</span><br><span class="line">│   │       ├── tasks.md</span><br><span class="line">│   │       └── specs/           # Delta Specs</span><br><span class="line">│   │           └── &lt;domain&gt;/</span><br><span class="line">│   │               └── spec.md</span><br><span class="line">│   └── config.yaml              # 项目配置（可选）</span><br><span class="line">└── src/                         # 你的源代码</span><br></pre></td></tr></table></figure><h3 id="7-2-各文件详解"><a href="#7-2-各文件详解" class="headerlink" title="7.2 各文件详解"></a>7.2 各文件详解</h3><p><strong><code>openspec/specs/&lt;domain&gt;/spec.md</code></strong> — 系统当前行为的真相源文档</p><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># <span class="language-xml"><span class="tag">&lt;<span class="name">Domain</span>&gt;</span></span> Specification</span></span><br><span class="line"></span><br><span class="line"><span class="section">## Purpose</span></span><br><span class="line">[这个领域做什么]</span><br><span class="line"></span><br><span class="line"><span class="section">## Requirements</span></span><br><span class="line"></span><br><span class="line"><span class="section">### Requirement: &lt;名称&gt;</span></span><br><span class="line">[需求描述]</span><br><span class="line"></span><br><span class="line"><span class="section">#### Scenario: &lt;场景名&gt;</span></span><br><span class="line"><span class="bullet">-</span> GIVEN &lt;前置条件&gt;</span><br><span class="line"><span class="bullet">-</span> WHEN &lt;触发事件&gt;</span><br><span class="line"><span class="bullet">-</span> THEN &lt;预期结果&gt;</span><br></pre></td></tr></table></figure><p><strong><code>openspec/changes/&lt;change-name&gt;/proposal.md</code></strong> — 「为什么做」和「做什么」</p><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># Proposal: &lt;变更名称&gt;</span></span><br><span class="line"></span><br><span class="line"><span class="section">## Intent</span></span><br><span class="line">[为什么要做这个变更]</span><br><span class="line"></span><br><span class="line"><span class="section">## Scope</span></span><br><span class="line"><span class="bullet">-</span> [包含的范围]</span><br><span class="line"><span class="bullet">-</span> [不包括的范围]</span><br><span class="line"></span><br><span class="line"><span class="section">## Approach</span></span><br><span class="line">[大致的技术思路]</span><br></pre></td></tr></table></figure><p><strong><code>openspec/changes/&lt;change-name&gt;/specs/&lt;domain&gt;/spec.md</code></strong> — Delta Spec，只描述增量变化</p><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># Delta for <span class="language-xml"><span class="tag">&lt;<span class="name">Domain</span>&gt;</span></span></span></span><br><span class="line"></span><br><span class="line"><span class="section">## ADDED Requirements</span></span><br><span class="line"><span class="section">### Requirement: &lt;新需求&gt;</span></span><br><span class="line">[描述]</span><br><span class="line"></span><br><span class="line"><span class="section">## MODIFIED Requirements</span></span><br><span class="line"><span class="section">### Requirement: &lt;已有需求&gt;</span></span><br><span class="line">[新描述]</span><br><span class="line">（原内容）</span><br><span class="line"></span><br><span class="line"><span class="section">## REMOVED Requirements</span></span><br><span class="line"><span class="section">### Requirement: &lt;要删除的需求&gt;</span></span><br><span class="line">（[原因]）</span><br></pre></td></tr></table></figure><p><strong><code>openspec/changes/&lt;change-name&gt;/tasks.md</code></strong> — 实现检查清单，Checkbox 格式</p><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># Tasks</span></span><br><span class="line"></span><br><span class="line"><span class="section">## &lt;分组&gt;</span></span><br><span class="line"><span class="bullet">-</span> [ ] &lt;任务ID&gt; &lt;描述&gt;</span><br><span class="line"><span class="bullet">-</span> [x] &lt;已完成任务&gt;</span><br></pre></td></tr></table></figure><hr><h2 id="八、入门指南"><a href="#八、入门指南" class="headerlink" title="八、入门指南"></a>八、入门指南</h2><h3 id="8-1-安装"><a href="#8-1-安装" class="headerlink" title="8.1 安装"></a>8.1 安装</h3><p><strong>前置条件</strong>：Node.js &gt;&#x3D; 20.19.0</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 全局安装</span></span><br><span class="line">npm install -g @fission-ai/openspec@latest</span><br><span class="line"></span><br><span class="line"><span class="comment"># 验证安装</span></span><br><span class="line">openspec --version</span><br></pre></td></tr></table></figure><p>也支持 pnpm、yarn、bun 和 Nix。</p><h3 id="8-2-初始化项目"><a href="#8-2-初始化项目" class="headerlink" title="8.2 初始化项目"></a>8.2 初始化项目</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line"><span class="built_in">cd</span> your-project</span><br><span class="line">openspec init</span><br></pre></td></tr></table></figure><p>这会在项目根目录创建 <code>openspec/</code> 目录和 <code>AGENTS.md</code> 文件。</p><h3 id="8-3-开始你的第一个变更"><a href="#8-3-开始你的第一个变更" class="headerlink" title="8.3 开始你的第一个变更"></a>8.3 开始你的第一个变更</h3><p><strong>方式一：快速路径（推荐新手）</strong></p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br></pre></td><td class="code"><pre><span class="line">你: /opsx:propose add-user-authentication</span><br><span class="line"></span><br><span class="line">AI:  Created openspec/changes/add-user-authentication/</span><br><span class="line">     ✓ proposal.md</span><br><span class="line">     ✓ specs/auth/spec.md</span><br><span class="line">     ✓ design.md</span><br><span class="line">     ✓ tasks.md</span><br><span class="line">     Ready for implementation!</span><br><span class="line"></span><br><span class="line">你: /opsx:apply</span><br><span class="line"></span><br><span class="line">AI:  Working through tasks...</span><br><span class="line">     [AI 开始实现，检查每个 checkbox]</span><br><span class="line"></span><br><span class="line">你: /opsx:archive</span><br></pre></td></tr></table></figure><p><strong>方式二：扩展工作流</strong></p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br></pre></td><td class="code"><pre><span class="line">你: /opsx:new add-user-authentication</span><br><span class="line"></span><br><span class="line">AI:  Created openspec/changes/add-user-authentication/</span><br><span class="line">     Schema: spec-driven</span><br><span class="line">     Ready to create: proposal</span><br><span class="line"></span><br><span class="line">你: /opsx:continue    # 逐步创建每个 Artifact</span><br><span class="line"></span><br><span class="line">AI:  Artifact status:</span><br><span class="line">     ✓ proposal (done)</span><br><span class="line">     ◆ specs (ready)</span><br><span class="line">     ◆ design (ready)</span><br><span class="line">     ○ tasks (blocked - needs: specs)</span><br><span class="line"></span><br><span class="line">你: /opsx:ff           # 快速创建剩余 Artifact</span><br></pre></td></tr></table></figure><h3 id="8-4-日常维护命令"><a href="#8-4-日常维护命令" class="headerlink" title="8.4 日常维护命令"></a>8.4 日常维护命令</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 查看活跃变更列表</span></span><br><span class="line">openspec list</span><br><span class="line"></span><br><span class="line"><span class="comment"># 查看变更详情</span></span><br><span class="line">openspec show &lt;change-name&gt;</span><br><span class="line"></span><br><span class="line"><span class="comment"># 验证规格格式</span></span><br><span class="line">openspec validate &lt;change-name&gt;</span><br><span class="line"></span><br><span class="line"><span class="comment"># 交互式仪表板</span></span><br><span class="line">openspec view</span><br><span class="line"></span><br><span class="line"><span class="comment"># 更新 AI 指令（每次 OpenSpec 升级后）</span></span><br><span class="line">openspec update</span><br></pre></td></tr></table></figure><h3 id="8-5-启用扩展命令"><a href="#8-5-启用扩展命令" class="headerlink" title="8.5 启用扩展命令"></a>8.5 启用扩展命令</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br></pre></td><td class="code"><pre><span class="line">openspec config profile</span><br><span class="line"><span class="comment"># 选择 &quot;workflows&quot;</span></span><br><span class="line">openspec update</span><br></pre></td></tr></table></figure><hr><h2 id="九、实践案例：电商网站的-Dark-Mode-功能"><a href="#九、实践案例：电商网站的-Dark-Mode-功能" class="headerlink" title="九、实践案例：电商网站的 Dark Mode 功能"></a>九、实践案例：电商网站的 Dark Mode 功能</h2><h3 id="Step-1：提出变更"><a href="#Step-1：提出变更" class="headerlink" title="Step 1：提出变更"></a>Step 1：提出变更</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line">你: /opsx:propose add-dark-mode</span><br><span class="line"></span><br><span class="line">AI:  Created openspec/changes/add-dark-mode/</span><br><span class="line">     ✓ proposal.md — 动机、范围</span><br><span class="line">     ✓ specs/ui/spec.md — 需求和场景</span><br><span class="line">     ✓ design.md — 技术方案</span><br><span class="line">     ✓ tasks.md — 实现检查清单</span><br></pre></td></tr></table></figure><h3 id="Step-2：检查生成的产物"><a href="#Step-2：检查生成的产物" class="headerlink" title="Step 2：检查生成的产物"></a>Step 2：检查生成的产物</h3><p><strong>proposal.md：</strong></p><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># Proposal: Add Dark Mode</span></span><br><span class="line"></span><br><span class="line"><span class="section">## Intent</span></span><br><span class="line">用户请求深色模式选项，以减少夜间使用的眼睛疲劳。</span><br><span class="line"></span><br><span class="line"><span class="section">## Scope</span></span><br><span class="line"><span class="bullet">-</span> 在设置中添加主题切换</span><br><span class="line"><span class="bullet">-</span> 支持系统偏好检测</span><br><span class="line"><span class="bullet">-</span> 在 localStorage 中持久化偏好</span><br><span class="line"></span><br><span class="line"><span class="section">## Approach</span></span><br><span class="line">使用 CSS 自定义属性实现主题化，React Context 管理状态。</span><br></pre></td></tr></table></figure><p><strong>specs&#x2F;ui&#x2F;spec.md（Delta）：</strong></p><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># Delta for UI</span></span><br><span class="line"></span><br><span class="line"><span class="section">## ADDED Requirements</span></span><br><span class="line"></span><br><span class="line"><span class="section">### Requirement: Theme Selection</span></span><br><span class="line">系统应允许用户在浅色和深色主题之间选择。</span><br><span class="line"></span><br><span class="line"><span class="section">#### Scenario: Manual toggle</span></span><br><span class="line"><span class="bullet">-</span> GIVEN 用户在任何页面</span><br><span class="line"><span class="bullet">-</span> WHEN 用户点击主题切换</span><br><span class="line"><span class="bullet">-</span> THEN 主题立即切换</span><br><span class="line"><span class="bullet">-</span> AND 偏好跨会话持久化</span><br><span class="line"></span><br><span class="line"><span class="section">#### Scenario: System preference</span></span><br><span class="line"><span class="bullet">-</span> GIVEN 用户无保存的偏好</span><br><span class="line"><span class="bullet">-</span> WHEN 应用加载</span><br><span class="line"><span class="bullet">-</span> THEN 使用系统首选颜色方案</span><br></pre></td></tr></table></figure><p><strong>tasks.md：</strong></p><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># Tasks</span></span><br><span class="line"></span><br><span class="line"><span class="section">## 1. Theme Infrastructure</span></span><br><span class="line"><span class="bullet">-</span> [ ] 1.1 Create ThemeContext with light/dark state</span><br><span class="line"><span class="bullet">-</span> [ ] 1.2 Add CSS custom properties for colors</span><br><span class="line"><span class="bullet">-</span> [ ] 1.3 Implement localStorage persistence</span><br><span class="line"></span><br><span class="line"><span class="section">## 2. UI Components</span></span><br><span class="line"><span class="bullet">-</span> [ ] 2.1 Create ThemeToggle component</span><br><span class="line"><span class="bullet">-</span> [ ] 2.2 Add toggle to settings page</span><br><span class="line"><span class="bullet">-</span> [ ] 2.3 Update Header to include quick toggle</span><br><span class="line"></span><br><span class="line"><span class="section">## 3. Styling</span></span><br><span class="line"><span class="bullet">-</span> [ ] 3.1 Define dark theme color palette</span><br><span class="line"><span class="bullet">-</span> [ ] 3.2 Update components to use CSS variables</span><br></pre></td></tr></table></figure><h3 id="Step-3：实施"><a href="#Step-3：实施" class="headerlink" title="Step 3：实施"></a>Step 3：实施</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br></pre></td><td class="code"><pre><span class="line">你: /opsx:apply</span><br><span class="line"></span><br><span class="line">AI:  Implementing add-dark-mode...</span><br><span class="line"></span><br><span class="line">     Reading tasks.md...</span><br><span class="line">     - [ ] 1.1 Create ThemeContext</span><br><span class="line">     - [ ] 1.2 Add CSS custom properties</span><br><span class="line">     ...</span><br><span class="line"></span><br><span class="line">     Working on 1.1: Create ThemeContext...</span><br><span class="line">     [创建 src/context/ThemeContext.tsx]</span><br><span class="line">     ✓ 1.1 ThemeContext created</span><br><span class="line"></span><br><span class="line">     Working on 1.2: Add CSS custom properties...</span><br><span class="line">     [更新 src/styles/globals.css]</span><br><span class="line">     ✓ 1.2 CSS custom properties added</span><br><span class="line">     ...</span><br></pre></td></tr></table></figure><h3 id="Step-4：归档"><a href="#Step-4：归档" class="headerlink" title="Step 4：归档"></a>Step 4：归档</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br></pre></td><td class="code"><pre><span class="line">你: /opsx:archive</span><br><span class="line"></span><br><span class="line">AI:  Archiving add-dark-mode...</span><br><span class="line">     ✓ Merged ADDED requirements into openspec/specs/ui/spec.md</span><br><span class="line">     ✓ Moved to openspec/changes/archive/2025-01-24-add-dark-mode/</span><br><span class="line">     Done!</span><br></pre></td></tr></table></figure><hr><h2 id="十、常见问题"><a href="#十、常见问题" class="headerlink" title="十、常见问题"></a>十、常见问题</h2><h3 id="Q1：OpenSpec-和传统-PRD-Spec-文档有什么区别？"><a href="#Q1：OpenSpec-和传统-PRD-Spec-文档有什么区别？" class="headerlink" title="Q1：OpenSpec 和传统 PRD&#x2F;Spec 文档有什么区别？"></a>Q1：OpenSpec 和传统 PRD&#x2F;Spec 文档有什么区别？</h3><table><thead><tr><th>维度</th><th>传统文档</th><th>OpenSpec</th></tr></thead><tbody><tr><td>用途</td><td>给人看</td><td>给人和 AI 看</td></tr><tr><td>变更管理</td><td>重写或版本对照</td><td>Delta Spec（增量描述）</td></tr><tr><td>与代码关联</td><td>分离</td><td>归档时自动合并到 specs&#x2F;</td></tr><tr><td>AI 可执行性</td><td>低</td><td>高（tasks.md 是可执行检查清单）</td></tr></tbody></table><h3 id="Q2：我已经有了现有代码库，OpenSpec-怎么用？"><a href="#Q2：我已经有了现有代码库，OpenSpec-怎么用？" class="headerlink" title="Q2：我已经有了现有代码库，OpenSpec 怎么用？"></a>Q2：我已经有了现有代码库，OpenSpec 怎么用？</h3><p><strong>Brownfield 是 OpenSpec 的首要场景。</strong></p><ol><li>先创建 <code>openspec init</code></li><li>用 <code>/opsx:propose &lt;improvement&gt;</code> 开始描述你想改什么</li><li>Delta Spec 机制让你只需要描述「改了什么」，不需要重写整个系统规格</li><li>归档时，增量自动合并到 <code>specs/</code></li></ol><h3 id="Q3：OpenSpec-支持哪些-AI-工具？"><a href="#Q3：OpenSpec-支持哪些-AI-工具？" class="headerlink" title="Q3：OpenSpec 支持哪些 AI 工具？"></a>Q3：OpenSpec 支持哪些 AI 工具？</h3><p>截至目前支持 <strong>25+ AI 编码助手</strong>，包括但不限于：</p><ul><li>Claude Code &#x2F; Claude Desktop</li><li>Cursor</li><li>Windsurf (Codeium)</li><li>Cline</li><li>GitHub Copilot</li><li>JetBrains AI Assistant</li><li>VS Code AI 插件</li></ul><p>完整列表见：<a href="https://github.com/Fission-AI/OpenSpec/blob/main/docs/supported-tools.md">Supported Tools 文档</a></p><h3 id="Q4：多个变更同时进行会发生冲突吗？"><a href="#Q4：多个变更同时进行会发生冲突吗？" class="headerlink" title="Q4：多个变更同时进行会发生冲突吗？"></a>Q4：多个变更同时进行会发生冲突吗？</h3><p>不会。每个 Change 有独立的文件夹，互不干扰。</p><ul><li>可以随时切换 Change 上下文</li><li>可以并行让 AI 处理不同 Change</li><li>归档时各自合并到主规格，无冲突（因为每个规格文件在同一 domain 下）</li></ul><h3 id="Q5：如果-AI-实现的代码和规格不一致怎么办？"><a href="#Q5：如果-AI-实现的代码和规格不一致怎么办？" class="headerlink" title="Q5：如果 AI 实现的代码和规格不一致怎么办？"></a>Q5：如果 AI 实现的代码和规格不一致怎么办？</h3><p>使用 <code>/opsx:verify</code>（Expanded 模式）来验证实现是否符合规格。验证结果会指出偏差。</p><h3 id="Q6：OpenSpec-适合什么规模的项目？"><a href="#Q6：OpenSpec-适合什么规模的项目？" class="headerlink" title="Q6：OpenSpec 适合什么规模的项目？"></a>Q6：OpenSpec 适合什么规模的项目？</h3><table><thead><tr><th>规模</th><th>方案</th></tr></thead><tbody><tr><td>个人项目</td><td>Repo-local <code>openspec/</code></td></tr><tr><td>小团队</td><td>Repo-local + 共享规格</td></tr><tr><td>跨多个仓库</td><td>OpenSpec Workspace</td></tr></tbody></table><h3 id="Q7：Schema-是什么？可以自定义吗？"><a href="#Q7：Schema-是什么？可以自定义吗？" class="headerlink" title="Q7：Schema 是什么？可以自定义吗？"></a>Q7：Schema 是什么？可以自定义吗？</h3><p>Schema 定义了 Artifact 的序列和依赖关系。OpenSpec 默认使用 <code>spec-driven</code> Schema（proposal → specs → design → tasks）。</p><p>高级用户可以通过 <a href="https://github.com/Fission-AI/OpenSpec/blob/main/docs/customization.md">Customization 文档</a> 创建自定义 Schema。</p><h3 id="Q8：如何升级-OpenSpec？"><a href="#Q8：如何升级-OpenSpec？" class="headerlink" title="Q8：如何升级 OpenSpec？"></a>Q8：如何升级 OpenSpec？</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">npm install -g @fission-ai/openspec@latest</span><br><span class="line">openspec update    <span class="comment"># 在每个项目中重新生成 AI 指令</span></span><br></pre></td></tr></table></figure><h3 id="Q9：OpenSpec-会收集遥测数据吗？"><a href="#Q9：OpenSpec-会收集遥测数据吗？" class="headerlink" title="Q9：OpenSpec 会收集遥测数据吗？"></a>Q9：OpenSpec 会收集遥测数据吗？</h3><p>默认<strong>不收集任何遥测数据</strong>。详见 <a href="https://github.com/Fission-AI/OpenSpec/blob/main/docs/telemetry.md">Telemetry 文档</a></p><h3 id="Q10：我可以在非-Node-js-项目中使用-OpenSpec-吗？"><a href="#Q10：我可以在非-Node-js-项目中使用-OpenSpec-吗？" class="headerlink" title="Q10：我可以在非 Node.js 项目中使用 OpenSpec 吗？"></a>Q10：我可以在非 Node.js 项目中使用 OpenSpec 吗？</h3><p>可以。OpenSpec 本质上是一套约定和文件结构，与语言&#x2F;框架无关。它通过 CLI 和 AI 斜杠命令工作，不需要项目使用 Node.js。</p><hr><h2 id="参考链接"><a href="#参考链接" class="headerlink" title="参考链接"></a>参考链接</h2><table><thead><tr><th>资源</th><th>链接</th></tr></thead><tbody><tr><td>官网</td><td><a href="https://openspec.dev/">https://openspec.dev/</a></td></tr><tr><td>GitHub</td><td><a href="https://github.com/Fission-AI/OpenSpec">https://github.com/Fission-AI/OpenSpec</a></td></tr><tr><td>Discord 社区</td><td><a href="https://discord.gg/YctCnvvshC">https://discord.gg/YctCnvvshC</a></td></tr><tr><td>入门文档</td><td><a href="https://github.com/Fission-AI/OpenSpec/blob/main/docs/getting-started.md">Getting Started</a></td></tr><tr><td>工作流</td><td><a href="https://github.com/Fission-AI/OpenSpec/blob/main/docs/workflows.md">Workflows</a></td></tr><tr><td>命令参考</td><td><a href="https://github.com/Fission-AI/OpenSpec/blob/main/docs/commands.md">Commands</a></td></tr><tr><td>概念说明</td><td><a href="https://github.com/Fission-AI/OpenSpec/blob/main/docs/concepts.md">Concepts</a></td></tr><tr><td>CLI 参考</td><td><a href="https://github.com/Fission-AI/OpenSpec/blob/main/docs/cli.md">CLI Reference</a></td></tr></tbody></table><hr><p><em>本文基于 OpenSpec 最新版本整理，所有信息来源于 GitHub 官方仓库。</em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/06/openspec-complete-guide/</id>
    <link href="https://iyangjialin.github.io/2026/05/06/openspec-complete-guide/"/>
    <published>2026-05-06T00:00:00.000Z</published>
    <summary>
      <![CDATA[<blockquote>
<p><strong>“The most loved spec framework.”</strong><br>GitHub: <a href="https://github.com/Fission-AI/OpenSpec">Fission-AI&#x2F;OpenSpec</a> · 45.4k ⭐ · MIT License</p>
</blockquote>
<hr>
<h2 id="目录"><a href="#目录" class="headerlink" title="目录"></a>目录</h2><ol>
<li><a href="#%E4%BB%80%E4%B9%88%E6%98%AF-openspec">什么是 OpenSpec</a></li>
<li><a href="#%E6%A0%B8%E5%BF%83%E4%BB%B7%E5%80%BC">核心价值</a></li>
<li><a href="#%E8%AE%BE%E8%AE%A1%E5%93%B2%E5%AD%A6">设计哲学</a></li>
<li><a href="#%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86">工作原理</a></li>
<li><a href="#%E5%AE%8C%E6%95%B4%E5%B7%A5%E4%BD%9C%E6%B5%81">完整工作流</a></li>
<li><a href="#%E6%8A%80%E6%9C%AF%E6%9E%B6%E6%9E%84%E5%88%86%E5%B1%82">技术架构分层</a></li>
<li><a href="#%E6%A0%87%E5%87%86%E9%A1%B9%E7%9B%AE%E7%BB%93%E6%9E%84%E4%B8%8E%E6%96%87%E4%BB%B6%E8%AF%B4%E6%98%8E">标准项目结构与文件说明</a></li>
<li><a href="#%E5%85%A5%E9%97%A8%E6%8C%87%E5%8D%97">入门指南</a></li>
<li><a href="#%E5%AE%9E%E8%B7%B5%E6%A1%88%E4%BE%8B">实践案例</a></li>
<li><a href="#%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98">常见问题</a></li>
</ol>]]>
    </summary>
    <title>OpenSpec 完全指南：AI 时代的规范驱动开发框架</title>
    <updated>2026-05-05T23:38:14.586Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="工程实践" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E5%B7%A5%E7%A8%8B%E5%AE%9E%E8%B7%B5/"/>
    <category term="Claude Code" scheme="https://iyangjialin.github.io/tags/Claude-Code/"/>
    <category term="Andrej Karpathy" scheme="https://iyangjialin.github.io/tags/Andrej-Karpathy/"/>
    <category term="LLM" scheme="https://iyangjialin.github.io/tags/LLM/"/>
    <category term="AI编码" scheme="https://iyangjialin.github.io/tags/AI%E7%BC%96%E7%A0%81/"/>
    <category term="Cursor" scheme="https://iyangjialin.github.io/tags/Cursor/"/>
    <category term="编码准则" scheme="https://iyangjialin.github.io/tags/%E7%BC%96%E7%A0%81%E5%87%86%E5%88%99/"/>
    <category term="开源项目" scheme="https://iyangjialin.github.io/tags/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE/"/>
    <content>
      <![CDATA[<blockquote><p><strong>“LLM 写的代码，不是太多，就是太乱。”</strong><br>Andrej Karpathy 对 AI 编码缺陷的一句话总结，催生了这个项目。</p></blockquote><p><code>andrej-karpathy-skills</code> 是一套轻量级的 LLM 编码行为护栏系统，将 Andrej Karpathy 提出的 LLM 编码典型失败模式，提炼为 <strong>4 条可落地的编码准则</strong>，以纯指令文本的形式适配 Claude Code、Cursor 等 AI 编码助手。</p><p>🔗 项目地址：<a href="https://github.com/forrestchang/andrej-karpathy-skills">github.com&#x2F;forrestchang&#x2F;andrej-karpathy-skills</a></p><span id="more"></span><hr><h2 id="🔍-项目背景：LLM-编码的四大痛点"><a href="#🔍-项目背景：LLM-编码的四大痛点" class="headerlink" title="🔍 项目背景：LLM 编码的四大痛点"></a>🔍 项目背景：LLM 编码的四大痛点</h2><p>Andrej Karpathy 曾系统性地指出，当前 LLM 在辅助编码时存在四类高频失败模式：</p><table><thead><tr><th>#</th><th>失败模式</th><th>典型表现</th></tr></thead><tbody><tr><td>1</td><td><strong>静默错误假设</strong></td><td>不澄清歧义，自行脑补，猜错了也不说</td></tr><tr><td>2</td><td><strong>过度复杂化</strong></td><td>用 1000 行实现本可 100 行完成的逻辑，堆砌冗余抽象</td></tr><tr><td>3</td><td><strong>无关代码改动</strong></td><td>修改不理解的注释、删除正交逻辑、”顺手”重构</td></tr><tr><td>4</td><td><strong>完成标准模糊</strong></td><td>缺乏可验证目标，无法判断任务是否真正完成</td></tr></tbody></table><p>这个项目的目标，就是把以上问题逐一消解——用 prompt 级别的指令约束，让 AI 编码助手的行为更可控、更可预期。</p><hr><h2 id="🧭-核心四大准则"><a href="#🧭-核心四大准则" class="headerlink" title="🧭 核心四大准则"></a>🧭 核心四大准则</h2><p>项目核心提炼了 4 条编码准则，每一条都精准对应上述痛点：</p><h3 id="1-Think-Before-Coding-—-编码前先思考"><a href="#1-Think-Before-Coding-—-编码前先思考" class="headerlink" title="1. Think Before Coding — 编码前先思考"></a>1. Think Before Coding — 编码前先思考</h3><p><strong>解决问题</strong>：LLM 静默做出错误假设、盲目猜答案</p><p><strong>核心要求</strong>：</p><ul><li>必须<strong>显性陈述假设</strong>，不允许隐藏前提</li><li>存在歧义时，给出<strong>多种解读方案</strong>，供用户选择</li><li>发现有更简单的方案时，<strong>主动提出</strong></li><li>有困惑时，<strong>先提问而非猜测</strong></li></ul><hr><h3 id="2-Simplicity-First-—-极简优先"><a href="#2-Simplicity-First-—-极简优先" class="headerlink" title="2. Simplicity First — 极简优先"></a>2. Simplicity First — 极简优先</h3><p><strong>解决问题</strong>：LLM 过度设计、代码膨胀、过早抽象</p><p><strong>核心要求</strong>：</p><ul><li>只编写解决问题的<strong>最小可行代码</strong></li><li>禁止以下行为：<ul><li>投机性功能（”以后可能用到”的代码）</li><li>过早抽象（单次使用的接口&#x2F;基类）</li><li>非必要的可配置性</li><li>无意义的异常处理（catch 住了什么都不做）</li></ul></li></ul><hr><h3 id="3-Surgical-Changes-—-精准修改"><a href="#3-Surgical-Changes-—-精准修改" class="headerlink" title="3. Surgical Changes — 精准修改"></a>3. Surgical Changes — 精准修改</h3><p><strong>解决问题</strong>：LLM 修改与任务无关的代码、范围蔓延</p><p><strong>核心要求</strong>：</p><ul><li><strong>仅触碰</strong>用户明确要求修改的内容</li><li>禁止以下行为：<ul><li>无关代码的”顺路优化”</li><li>风格重构（统一缩进&#x2F;命名等）</li><li>非自身产生的死代码清理</li></ul></li></ul><blockquote><p>类比外科手术：只处理病灶，不碰周围健康组织。</p></blockquote><hr><h3 id="4-Goal-Driven-Execution-—-目标驱动执行"><a href="#4-Goal-Driven-Execution-—-目标驱动执行" class="headerlink" title="4. Goal-Driven Execution — 目标驱动执行"></a>4. Goal-Driven Execution — 目标驱动执行</h3><p><strong>解决问题</strong>：LLM 无明确可验证的完成标准</p><p><strong>核心要求</strong>：</p><ul><li>为每个任务<strong>定义可验证的成功标准</strong>（例如：修复 bug → 先写复现测试用例，再让用例通过）</li><li>循环执行直至达标</li><li>多步骤任务需要明确<strong>带验证节点的执行计划</strong></li></ul><hr><h2 id="🏗️-项目架构"><a href="#🏗️-项目架构" class="headerlink" title="🏗️ 项目架构"></a>🏗️ 项目架构</h2><p>项目采用极简架构，<strong>无任何可运行的应用代码</strong>，核心价值全部承载于适配不同 AI 工具的指令文本文件中：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br></pre></td><td class="code"><pre><span class="line">andrej-karpathy-skills/</span><br><span class="line">├── CLAUDE.md                              # Claude Code 项目级指令文件</span><br><span class="line">├── README.md / README.zh.md              # 说明文档（中英文）</span><br><span class="line">├── EXAMPLES.md                            # 正反代码对比示例</span><br><span class="line">├── CURSOR.md                              # Cursor 编辑器适配说明</span><br><span class="line">├── .cursor/</span><br><span class="line">│   └── rules/karpathy-guidelines.mdc    # Cursor 项目级自动生效规则</span><br><span class="line">├── .claude-plugin/                        # Claude 插件配置</span><br><span class="line">└── skills/</span><br><span class="line">    └── karpathy-guidelines/</span><br><span class="line">        └── SKILL.md                       # Claude Code 全局技能定义</span><br></pre></td></tr></table></figure><p>三大核心指令文件（<code>CLAUDE.md</code> &#x2F; <code>.cursor/rules/karpathy-guidelines.mdc</code> &#x2F; <code>skills/karpathy-guidelines/SKILL.md</code>）<strong>内容完全一致</strong>，仅通过不同的元数据封装适配对应工具的原生格式，<strong>无需任何构建或转换脚本</strong>。</p><hr><h2 id="🔌-三种集成方式"><a href="#🔌-三种集成方式" class="headerlink" title="🔌 三种集成方式"></a>🔌 三种集成方式</h2><p>根据使用场景，项目提供了三条集成路径：</p><table><thead><tr><th>集成方式</th><th>适配工具</th><th>生效范围</th><th>操作成本</th><th>适用场景</th></tr></thead><tbody><tr><td><strong>Claude Code Plugin</strong></td><td>Claude Code</td><td>全局（所有项目）</td><td>2 条 CLI 命令</td><td>多仓库开发，一次安装全场景生效</td></tr><tr><td><strong>CLAUDE.md 文件</strong></td><td>Claude Code</td><td>单项目</td><td>1 条 curl 命令</td><td>单项目使用，或团队需纳入版本控制</td></tr><tr><td><strong>Cursor Rule（.mdc 文件）</strong></td><td>Cursor</td><td>单项目</td><td>复制 1 个文件</td><td>Cursor 用户，规则自动生效</td></tr></tbody></table><hr><h2 id="✅-效果验证：4-个可观测信号"><a href="#✅-效果验证：4-个可观测信号" class="headerlink" title="✅ 效果验证：4 个可观测信号"></a>✅ 效果验证：4 个可观测信号</h2><p>准则生效后，可以通过以下 4 个维度验证效果：</p><ol><li><strong>PR&#x2F;diff 干净</strong>：无不必要的修改，仅保留用户明确要求的代码变更</li><li><strong>首次实现即满足极简要求</strong>：无需反复要求 LLM “简化重写”</li><li><strong>LLM 先问后做</strong>：编码前主动提出澄清问题，而非先猜错再返工</li><li><strong>无范围外操作</strong>：无意外的重构、格式修改、无关注释删除</li></ol><hr><h2 id="⚠️-使用注意事项"><a href="#⚠️-使用注意事项" class="headerlink" title="⚠️ 使用注意事项"></a>⚠️ 使用注意事项</h2><p>准则天然偏向<strong>谨慎优先而非速度优先</strong>，以下场景可灵活放宽：</p><ul><li>改错别字、变量名等 trivial 修改</li><li>单行代码的明确替换</li><li>完全不涉及业务逻辑的格式调整</li></ul><p>初期交互可能因 LLM 前置提问显得略慢，但长期来看，<strong>可大幅减少交互轮次，显著提升复杂编码任务的输出质量</strong>。</p><hr><h2 id="📊-核心价值总结"><a href="#📊-核心价值总结" class="headerlink" title="📊 核心价值总结"></a>📊 核心价值总结</h2><table><thead><tr><th>维度</th><th>改善效果</th></tr></thead><tbody><tr><td><strong>代码质量</strong></td><td>减少无意义过度设计，代码更简洁可读</td></tr><tr><td><strong>变更安全性</strong></td><td>避免无关改动，降低引入新 bug 的风险</td></tr><tr><td><strong>可验证性</strong></td><td>以可验证目标为导向，改动能精准解决问题</td></tr><tr><td><strong>协作效率</strong></td><td>贴合资深工程师的编码思维，减少 AI 编码的”不接地气”问题</td></tr></tbody></table><hr><p>简而言之，这个项目把 Andrej Karpathy 对 LLM 编码的洞见，落地成了一套<strong>可直接部署的 AI 编码行为准则</strong>，让 Claude Code、Cursor 等工具写出更符合人类工程实践的代码。</p><p>对于频繁使用 AI 辅助编码的工程师来说，这 4 条准则值得认真落地。</p><hr><p><em>参考资料：<a href="https://github.com/forrestchang/andrej-karpathy-skills">项目 GitHub</a> · <a href="https://zread.ai/forrestchang/andrej-karpathy-skills">Zread 解读</a></em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/05/andrej-karpathy-skills/</id>
    <link href="https://iyangjialin.github.io/2026/05/05/andrej-karpathy-skills/"/>
    <published>2026-05-05T13:00:00.000Z</published>
    <summary>
      <![CDATA[<blockquote>
<p><strong>“LLM 写的代码，不是太多，就是太乱。”</strong><br>Andrej Karpathy 对 AI 编码缺陷的一句话总结，催生了这个项目。</p>
</blockquote>
<p><code>andrej-karpathy-skills</code> 是一套轻量级的 LLM 编码行为护栏系统，将 Andrej Karpathy 提出的 LLM 编码典型失败模式，提炼为 <strong>4 条可落地的编码准则</strong>，以纯指令文本的形式适配 Claude Code、Cursor 等 AI 编码助手。</p>
<p>🔗 项目地址：<a href="https://github.com/forrestchang/andrej-karpathy-skills">github.com&#x2F;forrestchang&#x2F;andrej-karpathy-skills</a></p>]]>
    </summary>
    <title>Andrej Karpathy 编码准则落地：karpathy-skills 项目全解析</title>
    <updated>2026-05-05T08:30:29.193Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="技术深度" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E6%8A%80%E6%9C%AF%E6%B7%B1%E5%BA%A6/"/>
    <category term="AI Agent" scheme="https://iyangjialin.github.io/tags/AI-Agent/"/>
    <category term="腾讯文档" scheme="https://iyangjialin.github.io/tags/%E8%85%BE%E8%AE%AF%E6%96%87%E6%A1%A3/"/>
    <category term="MCP协议" scheme="https://iyangjialin.github.io/tags/MCP%E5%8D%8F%E8%AE%AE/"/>
    <category term="技术分析" scheme="https://iyangjialin.github.io/tags/%E6%8A%80%E6%9C%AF%E5%88%86%E6%9E%90/"/>
    <category term="代码分析" scheme="https://iyangjialin.github.io/tags/%E4%BB%A3%E7%A0%81%E5%88%86%E6%9E%90/"/>
    <content>
      <![CDATA[<h1 id="腾讯文档-MCP-Skill-深度技术分析"><a href="#腾讯文档-MCP-Skill-深度技术分析" class="headerlink" title="腾讯文档 MCP Skill 深度技术分析"></a>腾讯文档 MCP Skill 深度技术分析</h1><p>腾讯文档（docs.qq.com）的 MCP Skill 包，提供完整的在线文档操作能力，支持 AI Agent 通过 MCP 协议创建、编辑、管理各类在线文档。</p><p>本文基于项目代码进行深度分析，剖析其架构设计、核心能力、优缺点及改进建议。</p><span id="more"></span><h2 id="支持的文档类型"><a href="#支持的文档类型" class="headerlink" title="支持的文档类型"></a>支持的文档类型</h2><table><thead><tr><th>类型</th><th>doc_type</th><th>说明</th></tr></thead><tbody><tr><td>智能文档</td><td>smartcanvas</td><td>MDX 格式，排版美观，支持丰富组件</td></tr><tr><td>Excel</td><td>sheet</td><td>数据表格，支持单元格操作、筛选、冻结等</td></tr><tr><td>PPT</td><td>slide</td><td>幻灯片演示文稿</td></tr><tr><td>思维导图</td><td>mind</td><td>层次化知识整理</td></tr><tr><td>流程图</td><td>flowchart</td><td>流程&#x2F;架构展示</td></tr><tr><td>Word</td><td>doc</td><td>传统文档格式</td></tr><tr><td>收集表</td><td>form</td><td>表单收集</td></tr><tr><td>智能表格</td><td>smartsheet</td><td>高级结构化表格，支持多视图</td></tr></tbody></table><h2 id="快速开始"><a href="#快速开始" class="headerlink" title="快速开始"></a>快速开始</h2><h3 id="1-安装依赖"><a href="#1-安装依赖" class="headerlink" title="1. 安装依赖"></a>1. 安装依赖</h3><p>需要 <a href="https://nodejs.org/">Node.js</a> 环境。</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">bash ./setup.sh</span><br></pre></td></tr></table></figure><p>脚本会自动安装 <code>mcporter</code> 并引导完成腾讯文档 OAuth 授权。</p><h3 id="2-授权流程"><a href="#2-授权流程" class="headerlink" title="2. 授权流程"></a>2. 授权流程</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 第一步：检查授权状态</span></span><br><span class="line">bash ./setup.sh tdoc_check_and_start_auth</span><br><span class="line"></span><br><span class="line"><span class="comment"># 第二步：在浏览器中完成授权后</span></span><br><span class="line">bash ./setup.sh tdoc_fetch_token</span><br></pre></td></tr></table></figure><p>也可直接传入 Token 跳过 OAuth：</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">bash ./setup.sh tdoc_set_token &lt;your-token&gt;</span><br></pre></td></tr></table></figure><p>Token 获取地址：<a href="https://docs.qq.com/scenario/open-claw.html">https://docs.qq.com/scenario/open-claw.html</a></p><h3 id="3-使用"><a href="#3-使用" class="headerlink" title="3. 使用"></a>3. 使用</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 查看可用工具</span></span><br><span class="line">mcporter list tencent-docs</span><br><span class="line"></span><br><span class="line"><span class="comment"># 调用工具</span></span><br><span class="line">mcporter call <span class="string">&quot;tencent-docs&quot;</span> <span class="string">&quot;&lt;工具名&gt;&quot;</span> --args <span class="string">&#x27;&lt;JSON参数&gt;&#x27;</span></span><br></pre></td></tr></table></figure><h2 id="项目结构"><a href="#项目结构" class="headerlink" title="项目结构"></a>项目结构</h2><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br></pre></td><td class="code"><pre><span class="line">├── SKILL.md                           # 入口文件，全局导航与核心规则</span><br><span class="line">├── setup.sh                           # 安装与授权脚本</span><br><span class="line">├── import_file.sh                     # 文件导入辅助脚本</span><br><span class="line">├── ocr.js                            # 本地图片 OCR 辅助脚本</span><br><span class="line">├── references/                        # 参考文档</span><br><span class="line">│   ├── auth.md                       # 鉴权与授权流程</span><br><span class="line">│   ├── workflows.md                  # 公共接口与常见工作流</span><br><span class="line">│   ├── smartsheet_references.md      # 智能表格操作</span><br><span class="line">│   ├── slide_references.md           # 幻灯片生成</span><br><span class="line">│   ├── diagram_references.md         # 思维导图 + 流程图</span><br><span class="line">│   ├── docengine_references.md       # Word 文档精细编辑</span><br><span class="line">│   ├── space_references.md           # 知识库空间管理</span><br><span class="line">│   ├── manage_references.md          # 文件管理</span><br><span class="line">│   ├── ocr_references.md             # OCR 图片识别</span><br><span class="line">│   └── unsupported_feature_reporting.md</span><br><span class="line">├── smartcanvas/                      # 智能文档模块</span><br><span class="line">│   ├── entry.md                     # 智能文档入口</span><br><span class="line">│   └── mdx_references.md           # MDX 格式规范</span><br><span class="line">├── doc/                              # Word 文档模块</span><br><span class="line">│   ├── entry.md                     # Word 品类入口</span><br><span class="line">│   └── doc_format/                  # Word 格式定义与模板</span><br><span class="line">└── sheet/                           # Excel 文档模块</span><br><span class="line">    ├── entry.md                     # Sheet 品类入口</span><br><span class="line">    └── api/                        # Sheet API 定义</span><br></pre></td></tr></table></figure><h2 id="核心功能"><a href="#核心功能" class="headerlink" title="核心功能"></a>核心功能</h2><ul><li><strong>创建文档</strong> — 支持智能文档（MDX）、Excel、PPT、思维导图、流程图、Word 等多种格式</li><li><strong>编辑文档</strong> — 智能文档支持插入、删除、修改、分栏布局等操作</li><li><strong>表格操作</strong> — 单元格读写、样式设置、合并单元格、筛选冻结、子表管理</li><li><strong>文件管理</strong> — 搜索、重命名、移动、删除、复制、导入导出、权限设置</li><li><strong>知识库空间</strong> — 创建空间、管理节点与文件夹结构</li><li><strong>网页剪藏</strong> — 抓取网页内容自动保存为智能文档</li><li><strong>OCR 识别</strong> — 图片提取文字、图片转 Word&#x2F;Excel</li></ul><h2 id="版本"><a href="#版本" class="headerlink" title="版本"></a>版本</h2><p>当前版本：<code>1.0.32</code></p><p>支持自动更新检查，详见 SKILL.md 中的”SKILL 更新”章节。</p><h2 id="相关链接"><a href="#相关链接" class="headerlink" title="相关链接"></a>相关链接</h2><ul><li>腾讯文档主页：<a href="https://docs.qq.com/home">https://docs.qq.com/home</a></li><li>获取 Token：<a href="https://docs.qq.com/scenario/open-claw.html">https://docs.qq.com/scenario/open-claw.html</a></li><li>VIP 升级：<a href="https://docs.qq.com/vip?immediate_buy=1">https://docs.qq.com/vip?immediate_buy=1</a></li></ul><hr><h1 id="深度代码分析"><a href="#深度代码分析" class="headerlink" title="深度代码分析"></a>深度代码分析</h1><p>基于项目代码分析，这个腾讯文档 MCP Skill 包有以下主要优点：</p><h2 id="一、文档类型覆盖全面"><a href="#一、文档类型覆盖全面" class="headerlink" title="一、文档类型覆盖全面"></a>一、文档类型覆盖全面</h2><p>支持 8 种文档类型：智能文档（smartcanvas）、Excel、PPT、思维导图、流程图、Word、收集表、智能表格。基本涵盖了在线办公的所有场景。</p><h2 id="二、智能文档（SmartCanvas）能力强"><a href="#二、智能文档（SmartCanvas）能力强" class="headerlink" title="二、智能文档（SmartCanvas）能力强"></a>二、智能文档（SmartCanvas）能力强</h2><ul><li><strong>MDX 格式向下兼容全部 Markdown 语法</strong>，不需要额外学习新语法即可上手</li><li>支持分栏布局、高亮块、待办列表、表格等高级排版组件，比纯 Markdown 表达力更强</li><li>内置 38 个模板（工作总结、述职报告、商业计划书、竞品分析等），开箱即用</li></ul><h2 id="三、编辑能力精细"><a href="#三、编辑能力精细" class="headerlink" title="三、编辑能力精细"></a>三、编辑能力精细</h2><ul><li>智能文档支持 <code>find</code> → <code>edit</code> 工作流：先搜索定位内容块，再精准插入&#x2F;删除&#x2F;修改</li><li>Excel 支持单元格级操作：设置值、样式、合并、筛选、冻结、行高列宽、子表管理等</li><li>不是简单的”创建就完事”，而是支持持续编辑和增量更新</li></ul><h2 id="四、工具设计成熟"><a href="#四、工具设计成熟" class="headerlink" title="四、工具设计成熟"></a>四、工具设计成熟</h2><ul><li><strong>统一鉴权</strong> — 一个 Token 通行所有文档类型，OAuth 流程自动化</li><li><strong>场景路由表</strong> — 根据任务类型快速找到对应工具和文档，降低使用门槛</li><li><strong>异步任务处理</strong> — PPT 生成、网页剪藏等耗时操作支持异步轮询，不阻塞用户交互</li><li><strong>图片处理统一</strong> — 所有图片统一通过 <code>upload_image</code> 上传获取 <code>image_id</code>，避免外链失效</li><li><strong>不支持能力自动上报</strong> — 遇到不支持的功能会静默上报，推动产品迭代</li></ul><h2 id="五、文件管理完善"><a href="#五、文件管理完善" class="headerlink" title="五、文件管理完善"></a>五、文件管理完善</h2><p>支持搜索、重命名、移动、删除、复制、导入导出、权限设置，以及知识库空间管理，不只是”能创建”，还能做完整的文档生命周期管理。</p><h2 id="六、辅助工具贴心"><a href="#六、辅助工具贴心" class="headerlink" title="六、辅助工具贴心"></a>六、辅助工具贴心</h2><ul><li><code>import_file.sh</code> — 本地文件上传到云端，保留原文件结构</li><li><code>ocr.js</code> — 本地图片 OCR 识别，支持图片转 Word&#x2F;Excel</li><li><code>scrape_url</code> — 网页剪藏自动保存为智能文档</li></ul><hr><h1 id="不足分析"><a href="#不足分析" class="headerlink" title="不足分析"></a>不足分析</h1><p>总体来说，它的定位不只是一个简单的文档创建 API 封装，而是一个<strong>完整的在线文档操作平台</strong>，从创建、编辑、管理到导入导出形成了闭环，且针对 AI Agent 的使用场景做了大量适配（模板匹配、场景路由、异步轮询等）。</p><p>但基于项目代码的深入分析，这个包存在以下不足：</p><h2 id="1-强依赖腾讯文档生态"><a href="#1-强依赖腾讯文档生态" class="headerlink" title="1. 强依赖腾讯文档生态"></a>1. 强依赖腾讯文档生态</h2><ul><li>必须使用 QQ 或微信扫码授权，绑定腾讯账号体系</li><li>Token 有过期机制，需要定期重新授权</li><li>部分功能需要 VIP 权限（400007 错误码）和积分（400008 错误码），有付费门槛</li><li>文档存储在腾讯云端，数据自主性受限</li></ul><h2 id="2-工具碎片化严重"><a href="#2-工具碎片化严重" class="headerlink" title="2. 工具碎片化严重"></a>2. 工具碎片化严重</h2><p>SKILL.md 中列出了 <code>smartcanvas.*</code>、<code>sheet.*</code>、<code>doc.*</code>、<code>smartsheet.*</code>、<code>ocr.*</code>、<code>manage.*</code> 等多套工具前缀，但缺乏统一的抽象层：</p><ul><li>同样是”读取文档内容”，智能文档用 <code>smartcanvas.read</code>，Excel 用 <code>sheet.get_cell_data</code>，通用读取又有 <code>get_content</code>，AI Agent 需要记住多套接口</li><li>不同文档类型的创建工具命名不统一：<code>create_smartcanvas_by_mdx</code>、<code>create_slide</code>、<code>create_flowchart_by_mermaid</code>，参数约定各不相同</li></ul><h2 id="3-智能文档编辑有严格约束"><a href="#3-智能文档编辑有严格约束" class="headerlink" title="3. 智能文档编辑有严格约束"></a>3. 智能文档编辑有严格约束</h2><ul><li><code>UPDATE</code> &#x2F; <code>DELETE</code> 操作<strong>必须先通过 <code>find</code> 或 <code>read</code> 获取 Block ID</strong>，不能凭记忆操作，每次编辑至少两次调用</li><li>带 <code>readonly</code> 属性的组件（如 Table）完全不可编辑，只能绕开操作</li><li><code>ColumnList</code> 删除列时有特殊约束（不能只剩 1 列），边界处理逻辑复杂</li><li>不支持对单个 <code>TableCell</code> 直接 UPDATE，必须替换整个 Table，操作粒度粗</li></ul><h2 id="4-图片处理链路长"><a href="#4-图片处理链路长" class="headerlink" title="4. 图片处理链路长"></a>4. 图片处理链路长</h2><p>所有图片必须先调用 <code>upload_image</code> 上传获取 <code>image_id</code>，禁止直接使用 URL：</p><ul><li>本地图片需要 <code>node ocr.js</code> 转 base64 再上传，链路长</li><li>图片过大上传失败时需要本地压缩后重试，没有自动降级机制</li><li>增加了网络开销和调用次数</li></ul><h2 id="5-异步任务体验差"><a href="#5-异步任务体验差" class="headerlink" title="5. 异步任务体验差"></a>5. 异步任务体验差</h2><p>PPT 生成（<code>create_slide</code>）、网页剪藏（<code>scrape_url</code>）等是异步操作：</p><ul><li>需要手动轮询进度（<code>scrape_progress</code>）</li><li>官方建议用”spawn 子会话专职轮询”，实现复杂度高</li><li>没有回调&#x2F;Webhook 机制，只能轮询</li></ul><h2 id="6-本地部署能力缺失"><a href="#6-本地部署能力缺失" class="headerlink" title="6. 本地部署能力缺失"></a>6. 本地部署能力缺失</h2><ul><li><code>setup.sh</code> 依赖 <code>curl</code>、<code>openssl</code>、<code>jq</code> 等工具，在 Windows 上兼容性存疑</li><li>所有操作通过 HTTP 调用腾讯文档 API，没有离线&#x2F;本地模式</li><li><code>import_file.sh</code> 依赖 COS（腾讯云对象存储），上传链路绑定腾讯云基础设施</li></ul><h2 id="7-错误处理粗糙"><a href="#7-错误处理粗糙" class="headerlink" title="7. 错误处理粗糙"></a>7. 错误处理粗糙</h2><ul><li>错误码体系不够完整，大量场景归到 <code>ERROR:unknown</code>（见 <code>setup.sh:310</code>）</li><li><code>setup.sh</code> 中 <code>tdoc_fetch_token</code> 的 token 提取有 DEBUG 输出（第 262 行 <code>echo &quot;DEBUG:token=$token&quot;</code>），属于调试遗留</li><li>没有重试机制，网络抖动直接返回失败</li></ul><h2 id="8-缺少批量操作能力"><a href="#8-缺少批量操作能力" class="headerlink" title="8. 缺少批量操作能力"></a>8. 缺少批量操作能力</h2><ul><li>没有批量创建文档的接口</li><li>Excel 操作逐单元格调用（<code>set_cell_value</code> &#x2F; <code>set_range_value</code>），大数据量场景效率低</li><li>文件管理（重命名、移动、删除）也是单个操作，不支持批量</li></ul><h2 id="9-版本更新机制原始"><a href="#9-版本更新机制原始" class="headerlink" title="9. 版本更新机制原始"></a>9. 版本更新机制原始</h2><p>更新检查需要手动读取 frontmatter 中的 <code>version</code> 字段，再调用 <code>check_skill_update</code> 对比，没有自动更新能力，需要用户手动执行更新指令。</p><hr><h1 id="改进建议"><a href="#改进建议" class="headerlink" title="改进建议"></a>改进建议</h1><p>总结来看，主要问题集中在<strong>生态锁定</strong>、<strong>接口碎片化</strong>、<strong>编辑约束多</strong>、<strong>异步处理复杂</strong>这几个方面。作为 MCP Skill 封装，它对腾讯文档 API 的覆盖面不错，但抽象层设计和开发者体验还有较大提升空间。</p><p>基于前面分析的不足，按优先级给出改进建议：</p><h2 id="一、统一抽象层（影响最大）"><a href="#一、统一抽象层（影响最大）" class="headerlink" title="一、统一抽象层（影响最大）"></a>一、统一抽象层（影响最大）</h2><p>当前最大的问题是接口碎片化。建议加一个统一的文档操作层：</p><p><strong>统一读取</strong> — 做一个 <code>docs.read(file_id)</code> 入口，内部根据文档类型自动路由到 <code>smartcanvas.read</code> &#x2F; <code>sheet.get_cell_data</code> &#x2F; <code>get_content</code></p><p><strong>统一编辑</strong> — 做一个 <code>docs.edit(file_id, action, target, content)</code> 入口，对智能文档走 Block 编辑，对 Excel 走单元格操作，对其他类型走内容替换</p><p><strong>统一创建</strong> — <code>docs.create(type, title, content)</code> 一个入口，替代当前 <code>create_smartcanvas_by_mdx</code> &#x2F; <code>create_slide</code> &#x2F; <code>create_flowchart_by_mermaid</code> 等散落的工具</p><p>这样 AI Agent 只需记住 3 个核心 API，降低使用门槛。</p><h2 id="二、简化图片链路"><a href="#二、简化图片链路" class="headerlink" title="二、简化图片链路"></a>二、简化图片链路</h2><p>当前：本地图片 → <code>node ocr.js</code> → base64 → <code>upload_image</code> → image_id → 写入文档</p><p>改进方案：</p><ul><li>在 <code>smartcanvas.edit</code> &#x2F; <code>create_smartcanvas_by_mdx</code> 内部自动处理图片上传，用户只需传 URL 或本地路径</li><li>支持传入公网 URL 时自动下载上传，省去手动调用 <code>upload_image</code> 的步骤</li><li>大图自动压缩后再上传，去掉”上传失败需手动压缩”的人工介入</li></ul><h2 id="三、优化异步任务体验"><a href="#三、优化异步任务体验" class="headerlink" title="三、优化异步任务体验"></a>三、优化异步任务体验</h2><p>当前：spawn 子会话轮询，实现复杂</p><p>改进方案：</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 方案 A：同步等待（简单场景）</span></span><br><span class="line">docs.wait(task_id, <span class="built_in">timeout</span>=60)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 方案 B：回调通知（复杂场景）</span></span><br><span class="line">docs.create_slide(..., callback_url=<span class="string">&quot;...&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 方案 C：统一任务状态查询</span></span><br><span class="line">docs.task_status(task_id)  <span class="comment"># 替代散落的 scrape_progress 等</span></span><br></pre></td></tr></table></figure><p>至少提供一个 <code>docs.wait(task_id)</code> 的阻塞等待工具，让简单场景不需要手动轮询。</p><h2 id="四、增加批量操作能力"><a href="#四、增加批量操作能力" class="headerlink" title="四、增加批量操作能力"></a>四、增加批量操作能力</h2><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 批量设置单元格（当前已有 set_range_value，但可扩展）</span></span><br><span class="line">sheet.batch_update(file_id, [</span><br><span class="line">  &#123;<span class="string">&quot;range&quot;</span>: <span class="string">&quot;A1:C3&quot;</span>, <span class="string">&quot;values&quot;</span>: [[...]]&#125;,</span><br><span class="line">  &#123;<span class="string">&quot;range&quot;</span>: <span class="string">&quot;D1&quot;</span>, <span class="string">&quot;value&quot;</span>: <span class="string">&quot;标题&quot;</span>, <span class="string">&quot;style&quot;</span>: &#123;<span class="string">&quot;bold&quot;</span>: <span class="literal">true</span>&#125;&#125;</span><br><span class="line">])</span><br><span class="line"></span><br><span class="line"><span class="comment"># 批量文件操作</span></span><br><span class="line">manage.batch(file_id_list, action=<span class="string">&quot;move&quot;</span>, target_folder=<span class="string">&quot;...&quot;</span>)</span><br></pre></td></tr></table></figure><h2 id="五、改进智能文档编辑体验"><a href="#五、改进智能文档编辑体验" class="headerlink" title="五、改进智能文档编辑体验"></a>五、改进智能文档编辑体验</h2><p>当前问题：每次编辑至少 2 次调用（find + edit），readonly 组件不可操作</p><p>改进方案：</p><p><strong>内联定位</strong> — edit 工具支持文本匹配定位，不需要先 find：</p><figure class="highlight json"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br></pre></td><td class="code"><pre><span class="line"><span class="punctuation">&#123;</span></span><br><span class="line">  <span class="attr">&quot;file_id&quot;</span><span class="punctuation">:</span> <span class="string">&quot;xxx&quot;</span><span class="punctuation">,</span></span><br><span class="line">  <span class="attr">&quot;action&quot;</span><span class="punctuation">:</span> <span class="string">&quot;UPDATE&quot;</span><span class="punctuation">,</span></span><br><span class="line">  <span class="attr">&quot;locate&quot;</span><span class="punctuation">:</span> <span class="punctuation">&#123;</span><span class="attr">&quot;text&quot;</span><span class="punctuation">:</span> <span class="string">&quot;项目背景&quot;</span><span class="punctuation">&#125;</span><span class="punctuation">,</span></span><br><span class="line">  <span class="attr">&quot;content&quot;</span><span class="punctuation">:</span> <span class="string">&quot;新的项目背景内容&quot;</span></span><br><span class="line"><span class="punctuation">&#125;</span></span><br></pre></td></tr></table></figure><p>这样省掉一次 find 调用，内部实现为 find + edit 的组合即可。</p><p><strong>readonly 组件降级</strong> — 遇到 readonly Table 时，自动在 Table 前后寻找锚点插入，而不是返回错误让 AI Agent 自己处理。</p><h2 id="六、改进错误处理"><a href="#六、改进错误处理" class="headerlink" title="六、改进错误处理"></a>六、改进错误处理</h2><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 当前：粗糙的错误</span></span><br><span class="line">ERROR:unknown(ret=xxx, response=yyy)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 改进：结构化错误 + 重试建议</span></span><br><span class="line">&#123;</span><br><span class="line">  <span class="string">&quot;error&quot;</span>: &#123;</span><br><span class="line">    <span class="string">&quot;code&quot;</span>: <span class="string">&quot;NETWORK_TIMEOUT&quot;</span>,</span><br><span class="line">    <span class="string">&quot;message&quot;</span>: <span class="string">&quot;请求超时&quot;</span>,</span><br><span class="line">    <span class="string">&quot;retryable&quot;</span>: <span class="literal">true</span>,</span><br><span class="line">    <span class="string">&quot;retry_after&quot;</span>: 3</span><br><span class="line">  &#125;</span><br><span class="line">&#125;</span><br></pre></td></tr></table></figure><ul><li>为可重试错误（网络超时、限流）自动加 <code>retryable: true</code> 标记</li><li>SDK 层内置重试逻辑（3 次，指数退避）</li><li>清理 <code>setup.sh</code> 中的 DEBUG 输出</li></ul><h2 id="七、降低生态锁定"><a href="#七、降低生态锁定" class="headerlink" title="七、降低生态锁定"></a>七、降低生态锁定</h2><ul><li>支持本地文件操作模式（至少支持导出为本地文件）</li><li>图片上传支持自定义存储后端，不强制绑定腾讯 COS</li><li>提供文档内容的纯文本&#x2F;Markdown 导出，方便迁移到其他平台</li></ul><h2 id="优先级建议"><a href="#优先级建议" class="headerlink" title="优先级建议"></a>优先级建议</h2><table><thead><tr><th>优先级</th><th>改进项</th><th>投入</th><th>收益</th></tr></thead><tbody><tr><td>P0</td><td>统一抽象层</td><td>中</td><td>大幅降低使用门槛</td></tr><tr><td>P0</td><td>简化图片链路</td><td>小</td><td>减少一半的调用次数</td></tr><tr><td>P1</td><td>内联定位编辑</td><td>小</td><td>编辑操作减 1 次调用</td></tr><tr><td>P1</td><td>改进错误处理</td><td>小</td><td>提升稳定性</td></tr><tr><td>P2</td><td>异步任务优化</td><td>中</td><td>提升复杂场景体验</td></tr><tr><td>P2</td><td>批量操作</td><td>中</td><td>提升数据量大时的效率</td></tr><tr><td>P3</td><td>降低生态锁定</td><td>大</td><td>提升可迁移性</td></tr></tbody></table><p>其中<strong>统一抽象层</strong>和<strong>简化图片链路</strong>投入产出比最高，建议优先做。</p><hr><h2 id="总结"><a href="#总结" class="headerlink" title="总结"></a>总结</h2><p>腾讯文档 MCP Skill 是一个<strong>覆盖全面但抽象不足</strong>的 MCP 实现：</p><p>✅ <strong>优点</strong>：文档类型全覆盖、智能文档能力强、编辑能力精细、辅助工具完善<br>⚠️ <strong>不足</strong>：接口碎片化、编辑约束多、异步体验差、生态锁定强<br>🔧 <strong>改进方向</strong>：统一抽象层、简化图片链路、优化异步任务、增加批量操作</p><p>对于想要快速上手腾讯文档自动化的开发者，这是一个<strong>功能完整但需要一定学习成本</strong>的工具包。改进统一抽象层后，体验会提升一个档次。</p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/05/tencent-docs-mcp-skill-analysis/</id>
    <link href="https://iyangjialin.github.io/2026/05/05/tencent-docs-mcp-skill-analysis/"/>
    <published>2026-05-05T12:00:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="腾讯文档-MCP-Skill-深度技术分析"><a href="#腾讯文档-MCP-Skill-深度技术分析" class="headerlink" title="腾讯文档 MCP Skill 深度技术分析"></a>腾讯文档 MCP Skill 深度技术分析</h1><p>腾讯文档（docs.qq.com）的 MCP Skill 包，提供完整的在线文档操作能力，支持 AI Agent 通过 MCP 协议创建、编辑、管理各类在线文档。</p>
<p>本文基于项目代码进行深度分析，剖析其架构设计、核心能力、优缺点及改进建议。</p>]]>
    </summary>
    <title>腾讯文档 MCP Skill 深度技术分析</title>
    <updated>2026-05-04T23:09:47.754Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="产品体验" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E4%BA%A7%E5%93%81%E4%BD%93%E9%AA%8C/"/>
    <category term="WorkBuddy" scheme="https://iyangjialin.github.io/tags/WorkBuddy/"/>
    <category term="知识管理" scheme="https://iyangjialin.github.io/tags/%E7%9F%A5%E8%AF%86%E7%AE%A1%E7%90%86/"/>
    <category term="腾讯文档" scheme="https://iyangjialin.github.io/tags/%E8%85%BE%E8%AE%AF%E6%96%87%E6%A1%A3/"/>
    <category term="MCP协议" scheme="https://iyangjialin.github.io/tags/MCP%E5%8D%8F%E8%AE%AE/"/>
    <category term="AI办公" scheme="https://iyangjialin.github.io/tags/AI%E5%8A%9E%E5%85%AC/"/>
    <category term="技能配置" scheme="https://iyangjialin.github.io/tags/%E6%8A%80%E8%83%BD%E9%85%8D%E7%BD%AE/"/>
    <content>
      <![CDATA[<h1 id="WorkBuddy接入腾讯文档上线-「资料库」功能"><a href="#WorkBuddy接入腾讯文档上线-「资料库」功能" class="headerlink" title="WorkBuddy接入腾讯文档上线 「资料库」功能"></a>WorkBuddy接入腾讯文档上线 「资料库」功能</h1><p>WorkBuddy 上线全新「资料库」能力，首期深度嵌入「腾讯文档」，打造无缝衔接的知识工作台，成为行业首个与主流文档&#x2F;知识库产品深度集成的 AI 办公智能体。</p><p>现在开始，你腾讯文档里的所有资料，都可以直接在 WorkBuddy 里调用，动动手指「<strong>取 → 用 → 存</strong>」文件：</p><ol><li>左侧”资料库-腾讯文档”，选中特定文档给WorkBuddy  </li><li>下指令让 WorkBuddy 直接改 🤖  </li><li>保存&#x2F;另存为到腾讯文档 💾</li></ol><p>不用下载、不用上传、不用反复切换应用！形成完整的知识生产闭环 ✅</p><p>📲 <strong>手机也能用！</strong><br>这套体验WorkBuddy小程序端同步支持，随时随地接住你的灵感！</p><p>WorkBuddy 资料库能力上线，打通个人知识管理的最后一公里 🚀<br>快来体验吧～！</p><hr><h1 id="腾讯文档-MCP-技能使用指南（V1-0-32）"><a href="#腾讯文档-MCP-技能使用指南（V1-0-32）" class="headerlink" title="腾讯文档 MCP 技能使用指南（V1.0.32）"></a>腾讯文档 MCP 技能使用指南（V1.0.32）</h1><p>腾讯文档MCP技能是对接腾讯在线云文档平台（docs.qq.com）的标准化操作工具，覆盖文档全生命周期管理，是处理「新建&#x2F;编辑&#x2F;读取&#x2F;搜索&#x2F;管理腾讯文档」相关操作的首选工具。</p><span id="more"></span><h2 id="一、核心支持能力"><a href="#一、核心支持能力" class="headerlink" title="一、核心支持能力"></a>一、核心支持能力</h2><ol><li>创建全品类在线文档（文档&#x2F;Word&#x2F;Excel&#x2F;幻灯片&#x2F;思维导图&#x2F;流程图&#x2F;智能表格&#x2F;收集表）</li><li>知识库空间全管理（创建空间、查询空间列表、管理空间节点与文件夹结构）</li><li>文档内容读取与关键词搜索</li><li>在线文档、智能表格精细化编辑操作</li><li>文件全生命周期管理（重命名、移动、删除、复制、导入导出、权限设置）</li><li>网页剪藏、本地文件&#x2F;文档一键上云</li><li>图片OCR识别（图片转文字&#x2F;Word&#x2F;Excel）</li><li>不支持能力自动上报</li></ol><h2 id="二、文档类型与场景匹配"><a href="#二、文档类型与场景匹配" class="headerlink" title="二、文档类型与场景匹配"></a>二、文档类型与场景匹配</h2><h3 id="支持的文档类型清单"><a href="#支持的文档类型清单" class="headerlink" title="支持的文档类型清单"></a>支持的文档类型清单</h3><table><thead><tr><th align="left">文档类型</th><th align="left">doc_type</th><th align="left">推荐度</th><th align="left">核心说明</th></tr></thead><tbody><tr><td align="left">智能文档</td><td align="left">smartcanvas</td><td align="left">⭐⭐⭐ 首选</td><td align="left">排版美观，支持丰富组件；MDX格式兼容全部Markdown语法</td></tr><tr><td align="left">Excel表格</td><td align="left">sheet</td><td align="left">⭐⭐⭐</td><td align="left">数据计算、筛选、统计专用</td></tr><tr><td align="left">PPT幻灯片</td><td align="left">slide</td><td align="left">⭐⭐⭐</td><td align="left">演示文稿专用</td></tr><tr><td align="left">思维导图</td><td align="left">mind</td><td align="left">⭐⭐⭐</td><td align="left">层次化知识整理、知识图谱专用</td></tr><tr><td align="left">流程图</td><td align="left">flowchart</td><td align="left">⭐⭐⭐</td><td align="left">流程&#x2F;架构展示专用</td></tr><tr><td align="left">智能表格</td><td align="left">smartsheet</td><td align="left">⭐⭐⭐</td><td align="left">高级结构化数据管理，支持多视图、字段管理</td></tr><tr><td align="left">Word文档</td><td align="left">doc</td><td align="left">⭐⭐</td><td align="left">传统格式，适配论文、公文、合同等专业文档</td></tr><tr><td align="left">收集表</td><td align="left">form</td><td align="left">⭐⭐</td><td align="left">表单信息收集专用</td></tr></tbody></table><h3 id="核心场景路由表"><a href="#核心场景路由表" class="headerlink" title="核心场景路由表"></a>核心场景路由表</h3><table><thead><tr><th align="left">核心使用场景</th><th align="left">首选文档类型</th><th align="left">对应参考文档</th></tr></thead><tbody><tr><td align="left">报告、笔记、文章、总结、通用内容创作</td><td align="left">smartcanvas</td><td align="left"><code>smartcanvas/entry.md</code></td></tr><tr><td align="left">结构化数据管理</td><td align="left">smartsheet</td><td align="left"><code>references/smartsheet_references.md</code></td></tr><tr><td align="left">Excel数据计算、筛选、统计</td><td align="left">sheet</td><td align="left"><code>sheet/entry.md</code></td></tr><tr><td align="left">Word文档精细化编辑</td><td align="left">doc</td><td align="left"><code>references/docengine_references.md</code></td></tr><tr><td align="left">PPT&#x2F;演示文稿制作</td><td align="left">slide</td><td align="left"><code>references/slide_references.md</code></td></tr><tr><td align="left">思维导图&#x2F;流程图制作</td><td align="left">mind&#x2F;flowchart</td><td align="left"><code>references/diagram_references.md</code></td></tr><tr><td align="left">表单信息收集</td><td align="left">form</td><td align="left"><code>references/manage_references.md</code></td></tr><tr><td align="left">知识库空间&#x2F;文件夹管理</td><td align="left">—</td><td align="left"><code>references/space_references.md</code></td></tr><tr><td align="left">文件管理（重命名&#x2F;移动&#x2F;删除&#x2F;权限等）</td><td align="left">—</td><td align="left"><code>references/manage_references.md</code></td></tr><tr><td align="left">图片OCR识别&#x2F;图片转文档</td><td align="left">ocr.*</td><td align="left"><code>references/ocr_references.md</code></td></tr><tr><td align="left">网页剪藏、文档内容读取</td><td align="left">—</td><td align="left"><code>references/workflows.md</code></td></tr></tbody></table><h2 id="三、快速配置与调用方式"><a href="#三、快速配置与调用方式" class="headerlink" title="三、快速配置与调用方式"></a>三、快速配置与调用方式</h2><ol><li><p><strong>首次配置</strong>：首次使用需完成本地安装与授权注册，详细流程参考 <code>references/auth.md</code></p></li><li><p><strong>工具列表查询</strong>：执行以下命令查看完整可用工具及参数Schema</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">mcporter list tencent-docs</span><br></pre></td></tr></table></figure></li><li><p><strong>标准工具调用命令</strong></p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">mcporter call <span class="string">&quot;tencent-docs&quot;</span> <span class="string">&quot;&lt;工具名&gt;&quot;</span> --args <span class="string">&#x27;&lt;JSON参数&gt;&#x27;</span></span><br></pre></td></tr></table></figure></li><li><p><strong>通用响应结构</strong>：所有API返回均包含两个核心字段</p><ul><li><code>error</code>：错误信息，调用成功时为空</li><li><code>trace_id</code>：调用链追踪ID，用于问题排查</li></ul></li></ol><blockquote><p>注：参考文档参数与Schema冲突时，以<code>mcporter list tencent-docs</code>返回的Schema为准。</p></blockquote><h2 id="四、核心使用规则（强制遵守）"><a href="#四、核心使用规则（强制遵守）" class="headerlink" title="四、核心使用规则（强制遵守）"></a>四、核心使用规则（强制遵守）</h2><ol><li><strong>默认首选规则</strong>：除非用户明确指定其他格式，新增文档优先使用<code>create_smartcanvas_by_mdx</code>；编辑已有文档使用<code>smartcanvas.*</code>系列工具。</li><li><strong>Markdown内容处理</strong>：MDX格式完全兼容Markdown语法，Markdown内容直接填入<code>create_smartcanvas_by_mdx</code>的<code>mdx</code>参数即可，无需格式转换。</li><li><strong>本地文件上云规则</strong>：本地文件保存&#x2F;上云，一律使用<code>import_file.sh</code> → <code>manage.async_import</code> → <code>manage.import_progress</code>统一通路，保留原文件结构，不使用<code>create_*</code>工具重新生成内容。</li><li><strong>内容落盘规则</strong>：用户提出「整理&#x2F;保存&#x2F;归档&#x2F;转写&#x2F;沉淀&#x2F;会议纪要」等内容上云诉求时，优先使用<code>create_smartcanvas_by_mdx</code>。</li><li><strong>网页剪藏专属规则</strong>：用户提供URL链接时，必须优先使用<code>scrape_url</code> → <code>scrape_progress</code>网页剪藏专属工作流。</li><li><strong>OCR使用规则</strong>：<code>image_url</code>（公网URL）与<code>image_base64</code>严格二选一；本地图片必须使用<code>node ocr.js</code>脚本，禁止手动传base64。</li><li><strong>异步任务处理规则</strong>：PPT生成、网页剪藏等异步任务，推荐使用spawn子会话专职轮询，避免主会话阻塞。</li><li><strong>不支持能力处理规则</strong>：用户请求的功能无对应支持工具时，静默调用<code>report_unsupported_feature</code>上报，无需告知用户。</li><li><strong>目录创建规则</strong>：<code>create_*_by_markdown</code>和<code>create_flowchart_by_mermaid</code>支持<code>parent_id</code>参数指定创建目录；<code>create_smartcanvas_by_mdx</code>不支持该参数，默认创建在根目录。</li><li><strong>删除操作规则</strong>：<code>delete_space_node</code>默认仅删除当前节点（<code>remove_type=current</code>），使用<code>all</code>参数时会递归删除所有子节点，需谨慎操作。</li></ol><h2 id="五、高频标准工作流"><a href="#五、高频标准工作流" class="headerlink" title="五、高频标准工作流"></a>五、高频标准工作流</h2><ol><li><strong>搜索并读取文档</strong>：<code>manage.search_file</code>按关键词搜索 → 获取<code>file_id</code> → <code>get_content</code>读取文档完整内容</li><li><strong>智能表格操作</strong>：<code>smartsheet.list_tables</code>获取<code>sheet_id</code> → 使用<code>smartsheet.*</code>系列工具执行编辑操作</li><li><strong>文件管理操作</strong>：<code>manage.folder_list</code>获取目录结构 → 使用<code>manage.*</code>工具执行重命名、移动、删除、权限设置等操作</li><li><strong>网页剪藏</strong>：<code>scrape_url</code>抓取网页 → <code>scrape_progress</code>轮询进度 → 自动保存为智能文档</li><li><strong>OCR图片识别</strong>：公网URL图片直接调用<code>ocr.extract</code>&#x2F;<code>ocr.toword</code>&#x2F;<code>ocr.toexcel</code>；本地图片使用<code>node ocr.js</code>脚本处理</li></ol><h2 id="六、问题排查指南"><a href="#六、问题排查指南" class="headerlink" title="六、问题排查指南"></a>六、问题排查指南</h2><h3 id="常见错误码与解决方案"><a href="#常见错误码与解决方案" class="headerlink" title="常见错误码与解决方案"></a>常见错误码与解决方案</h3><table><thead><tr><th align="left">错误码</th><th align="left">错误类型</th><th align="left">标准解决方案</th></tr></thead><tbody><tr><td align="left">400006</td><td align="left">Token鉴权失败</td><td align="left">重新完成本地授权流程，参考<code>references/auth.md</code></td></tr><tr><td align="left">400007</td><td align="left">VIP权限不足</td><td align="left">访问<a href="https://docs.qq.com/vip?immediate_buy=1?part_aid=persnlspace_mcp">https://docs.qq.com/vip?immediate_buy=1?part_aid=persnlspace_mcp</a> 升级VIP</td></tr><tr><td align="left">400008</td><td align="left">积分不足</td><td align="left">访问<a href="https://docs.qq.com/vip/asset-center?tab=ai&fromPage=offsite&part_aid=offsite_claw">https://docs.qq.com/vip/asset-center?tab=ai&amp;fromPage=offsite&amp;part_aid=offsite_claw</a> 购买积分</td></tr><tr><td align="left">-32601</td><td align="left">请求接口错误</td><td align="left">确认调用的工具在<code>mcporter list tencent-docs</code>返回的列表中存在</td></tr><tr><td align="left">-32603 &#x2F; 11607</td><td align="left">请求参数错误</td><td align="left">核对<code>file_id</code>、<code>content</code>等必填参数，确认参数格式与规范匹配</td></tr></tbody></table><h3 id="标准排查步骤"><a href="#标准排查步骤" class="headerlink" title="标准排查步骤"></a>标准排查步骤</h3><ol><li>匹配错误码，按上表对应方案优先处理</li><li>执行<code>mcporter list tencent-docs</code>，确认工具存在且参数定义匹配</li><li>鉴权相关错误，重新执行授权流程</li><li>按场景路由表查阅对应参考文档，确认工具调用规范与约束</li></ol><h2 id="七、版本更新流程"><a href="#七、版本更新流程" class="headerlink" title="七、版本更新流程"></a>七、版本更新流程</h2><ol><li>查看当前版本：读取本文件顶部的<code>version</code>字段，格式为<code>MAJOR.MINOR.PATCH</code></li><li>检查最新版本：执行以下命令获取版本更新信息<figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">mcporter call <span class="string">&quot;https://docs.qq.com/openapi/mcp&quot;</span> <span class="string">&quot;check_skill_update&quot;</span> --args <span class="string">&#x27;&#123;&quot;version&quot;: &quot;&lt;当前版本号&gt;&quot;&#125;&#x27;</span></span><br></pre></td></tr></table></figure></li><li>版本更新：若当前版本低于返回的<code>latest</code>最新版本，遵循返回的<code>instruction</code>指令完成更新，或提示用户执行更新操作。</li><li>建议每日使用前执行一次版本更新检查。</li></ol><hr><h1 id="腾讯文档-×-WorkBuddy-实战使用案例合集"><a href="#腾讯文档-×-WorkBuddy-实战使用案例合集" class="headerlink" title="腾讯文档 × WorkBuddy 实战使用案例合集"></a>腾讯文档 × WorkBuddy 实战使用案例合集</h1><p>WorkBuddy 基于MCP协议与腾讯文档原生深度打通，用户完成一次账号授权后，即可通过自然语言指令，实现腾讯文档「读取&#x2F;搜索&#x2F;创建&#x2F;编辑&#x2F;归档」全流程自动化操作，无需手动下载、上传、切换应用，完成<strong>资料获取→AI加工→云端沉淀</strong>的完整工作流闭环。以下是覆盖个人办公、团队协作、业务落地三大维度的真实实战案例。</p><h2 id="一、个人办公效率提升类案例"><a href="#一、个人办公效率提升类案例" class="headerlink" title="一、个人办公效率提升类案例"></a>一、个人办公效率提升类案例</h2><h3 id="案例1：供应链从业者-自然语言驱动的个人工作流管理系统"><a href="#案例1：供应链从业者-自然语言驱动的个人工作流管理系统" class="headerlink" title="案例1：供应链从业者-自然语言驱动的个人工作流管理系统"></a>案例1：供应链从业者-自然语言驱动的个人工作流管理系统</h3><p><strong>场景痛点</strong>：供应链日常工作事项分散在微信、钉钉、OA、会议纪要中，订单交期跟进、紧急插单协调、设备异常处理、合同规格检查等多线程事项极易遗漏，传统手动记录待办、整理进度耗时且易出错。</p><p><strong>实操流程</strong>：</p><ol><li>完成WorkBuddy与腾讯文档授权，搭建专属的「订单跟进」智能文档与待办智能表格</li><li>全程通过微信WorkBuddy小程序用自然语言下达指令，无需打开电脑，示例指令：<ul><li>「记录 A销售公司XX产品插单今天达成共识了，预计4月17日安排生产，同步关联原3月月度订单文档」</li><li>「跟进XX车间设备改造异常事项，对接人小素，4月11日提醒我确认整改进度」</li></ul></li><li>WorkBuddy自动完成：拆解事项→写入腾讯文档对应表格→设置跟进提醒→关联相关文档→结构化梳理进展</li><li>到期自动触发提醒，同步更新事项状态，自动生成每日&#x2F;每周进展汇总。</li></ol><p><strong>落地效果</strong>：</p><ul><li>订单跟进事项遗漏率从15%降至0，跨部门协调响应效率提升60%</li><li>原本每天30分钟的事项整理工作，压缩至2分钟语音指令完成</li><li>所有工作进展可追溯，沉淀在腾讯文档中，随时可检索复盘。</li></ul><h3 id="案例2：职场人-全自动周报生成与归档"><a href="#案例2：职场人-全自动周报生成与归档" class="headerlink" title="案例2：职场人-全自动周报生成与归档"></a>案例2：职场人-全自动周报生成与归档</h3><p><strong>场景痛点</strong>：每周需手动整理本周工作内容、项目进展、下周计划，需从多个腾讯文档、表格中提取数据，手动排版汇总，单次耗时30分钟以上，重复机械工作占比高。</p><p><strong>实操流程</strong>：</p><ol><li>授权WorkBuddy访问个人腾讯文档工作目录，设置自动化规则：「每周五下午6点，自动读取本周项目文档、待办表格、会议纪要」</li><li>固定指令模板：「基于我本周腾讯文档内的所有工作内容，生成一份标准周报，包含本周核心成果、待解决问题、下周工作计划，格式适配公司周报模板，生成后直接保存到腾讯文档「周报归档」文件夹，命名格式：姓名-XXXX年第X周工作周报」</li><li>WorkBuddy自动执行：多文档内容读取→AI汇总提炼→按模板排版→自动创建并写入腾讯文档→同步归档到指定文件夹。</li></ol><p><strong>落地效果</strong>：</p><ul><li>周报制作耗时从30分钟压缩至10分钟审阅时间，省时98%</li><li>无需手动切换多个文档复制粘贴，格式零错乱，数据无遗漏</li><li>所有周报自动归档到腾讯文档，形成个人工作台账，随时可检索追溯。</li></ul><h3 id="案例3：内容创作者-报告-PPT自动化生成与云端同步"><a href="#案例3：内容创作者-报告-PPT自动化生成与云端同步" class="headerlink" title="案例3：内容创作者-报告&#x2F;PPT自动化生成与云端同步"></a>案例3：内容创作者-报告&#x2F;PPT自动化生成与云端同步</h3><p><strong>场景痛点</strong>：制作汇报PPT、行业报告时，需频繁从腾讯文档调取历史数据、参考方案，手动复制粘贴易出现格式错乱、图表丢失，多设备切换操作繁琐。</p><p><strong>实操流程</strong>：</p><ol><li>电脑端&#x2F;手机端均可下达指令，示例：「基于腾讯文档里的《Q1销售分析报告》内容，生成一份给老板汇报用的PPT，不超过10页，风格简洁商务，配色用深蓝+白色，包含封面、核心数据、问题分析、下一步计划」</li><li>WorkBuddy自动完成：精准定位腾讯文档目标文件→完整读取内容（含复杂表格、图表、版式）→生成PPT大纲与完整初稿→保留原数据格式不跑偏</li><li>生成完成后，一键回存到腾讯文档云端，手机、电脑多端实时同步，可直接打开分享、编辑。</li></ol><p><strong>落地效果</strong>：</p><ul><li>一份10页的商务PPT制作耗时从3小时压缩至15分钟，省时91.7%</li><li>表格、图表、版式完整保留，无格式错乱，无需手动二次调整</li><li>通勤路上即可通过手机小程序完成制作，无需携带电脑，碎片化时间高效利用。</li></ul><h2 id="二、团队协作与管理类案例"><a href="#二、团队协作与管理类案例" class="headerlink" title="二、团队协作与管理类案例"></a>二、团队协作与管理类案例</h2><h3 id="案例1：市场团队-竞品分析报告自动化全流程"><a href="#案例1：市场团队-竞品分析报告自动化全流程" class="headerlink" title="案例1：市场团队-竞品分析报告自动化全流程"></a>案例1：市场团队-竞品分析报告自动化全流程</h3><p><strong>场景痛点</strong>：每周需手动收集竞品官网、公众号、应用商店的最新动态，整理数据、撰写分析报告，单次耗时3小时以上，信息收集繁琐、更新不及时。</p><p><strong>实操流程</strong>：</p><ol><li>团队共享腾讯文档空间，授权WorkBuddy访问「竞品分析」知识库</li><li>设置自动化任务：「每周一上午9点，自动抓取指定3个竞品的官网、公众号、App Store最新动态，结构化存入腾讯文档「竞品动态」智能表格」</li><li>补充指令：「基于本周抓取的竞品动态，按照团队模板生成竞品分析报告，标注核心变化、潜在风险、我方应对建议，生成后保存到腾讯文档「竞品分析报告」文件夹，并@负责人审阅」</li><li>WorkBuddy全流程自动执行，无需人工干预，周一到岗即可直接审阅完整报告。</li></ol><p><strong>落地效果</strong>：</p><ul><li>每周竞品分析工作耗时从3小时压缩至10分钟审阅时间，效率提升94%</li><li>竞品动态抓取无遗漏，报告格式统一，团队成员可实时在腾讯文档中协同编辑、评论</li><li>所有历史报告、动态数据自动沉淀，形成团队竞品知识库，新人可快速查阅学习。</li></ul><h3 id="案例2：项目团队-跨部门协作事项跟进与待办闭环"><a href="#案例2：项目团队-跨部门协作事项跟进与待办闭环" class="headerlink" title="案例2：项目团队-跨部门协作事项跟进与待办闭环"></a>案例2：项目团队-跨部门协作事项跟进与待办闭环</h3><p><strong>场景痛点</strong>：跨部门项目协作中，事项对接人多、进度分散在不同群聊、会议中，待办事项跟进不及时，责任不清晰，极易出现延期。</p><p><strong>实操流程</strong>：</p><ol><li>项目组搭建腾讯文档共享空间，创建「项目跟进总表」智能表格，包含事项名称、对接人、截止时间、当前状态、风险等级等字段</li><li>会议结束后，直接在WorkBuddy下达指令：「把本次会议的待办事项拆解，对应到对接人、截止时间，写入腾讯文档的项目跟进总表，给每个事项设置到期前1天提醒，同步关联本次会议纪要文档」</li><li>日常跟进指令示例：「更新XX车间设备改造事项的状态为整改中，最新进展为已完成零件更换，预计4月11日完成验收，同步更新到项目跟进总表，给对接人小素设置4月11日的确认提醒」</li><li>WorkBuddy自动同步更新腾讯文档，到期自动触发提醒，每周自动生成项目进度汇总报告。</li></ol><p><strong>落地效果</strong>：</p><ul><li>项目任务延期率从25%降至3%，跨部门协作沟通成本降低70%</li><li>所有事项进度可追溯、责任到人，全程在腾讯文档中透明化管理</li><li>无需手动更新表格、反复提醒对接人，项目管理工作量大幅降低。</li></ul><h3 id="案例3：团队管理-知识库自动化运维与更新"><a href="#案例3：团队管理-知识库自动化运维与更新" class="headerlink" title="案例3：团队管理-知识库自动化运维与更新"></a>案例3：团队管理-知识库自动化运维与更新</h3><p><strong>场景痛点</strong>：团队腾讯文档知识库越来越臃肿，文档重复、内容过时、版本号错误等问题频发，新人找不到关键信息，手动维护耗时耗力。</p><p><strong>实操流程</strong>：</p><ol><li>授权WorkBuddy访问团队腾讯文档知识库空间，设置定期自动化任务：「每月1号，自动扫描知识库内所有文档」</li><li>设定AI执行规则：<ul><li>识别文档中的过时内容（过期政策、失效版本号、停用流程），标记并汇总</li><li>识别重复文档，标注相似度，推荐保留版本</li><li>基于文档内容生成知识图谱，可视化展示文档关联关系</li><li>为新人筛选生成「必读文档清单」，标注学习优先级</li></ul></li><li>所有扫描结果、维护报告自动保存到腾讯文档知识库首页，负责人只需确认执行即可。</li></ol><p><strong>落地效果</strong>：</p><ul><li>团队知识库维护成本降低70%，无需专人每月手动梳理</li><li>新人上手培训时间从2周缩短至3天，可快速通过必读清单掌握核心内容</li><li>知识库内容时效性、准确性大幅提升，重复文档、过时内容清零。</li></ul><h2 id="三、业务场景落地类案例"><a href="#三、业务场景落地类案例" class="headerlink" title="三、业务场景落地类案例"></a>三、业务场景落地类案例</h2><h3 id="案例1：商务-法务-合同智能审阅与修改意见自动归档"><a href="#案例1：商务-法务-合同智能审阅与修改意见自动归档" class="headerlink" title="案例1：商务&#x2F;法务-合同智能审阅与修改意见自动归档"></a>案例1：商务&#x2F;法务-合同智能审阅与修改意见自动归档</h3><p><strong>场景痛点</strong>：客户频繁通过微信发送合同PDF，需逐条审阅、标记风险点、对比公司报价单、出具修改意见，传统流程需反复下载、上传、切换工具，全程耗时久，易遗漏风险。</p><p><strong>实操流程</strong>：</p><ol><li>客户在微信群发来合同PDF，直接转发到WorkBuddy微信小程序</li><li>语音下达指令：「把这份合同和腾讯文档项目文件夹里的对应报价单一起审阅，整理一份对比意见，标记风险条款、不符合公司规范的内容，给出修改建议，生成正式的审阅报告，保存到腾讯文档对应项目文件夹」</li><li>WorkBuddy自动完成：文件读取→内容比对→风险识别→报告生成→自动写入腾讯文档，全程无需手动下载任何文件。</li><li>打开腾讯文档即可直接查看完整报告，一键转发给客户或团队，修改后的合同可直接回存归档。</li></ol><p><strong>落地效果</strong>：</p><ul><li>单份合同审阅耗时从2小时压缩至5分钟，风险识别准确率提升至92%</li><li>全程无下载、无上传、无应用切换，微信内即可完成全流程操作</li><li>所有合同、审阅报告自动归档到腾讯文档，形成完整业务台账，可随时检索追溯。</li></ul><h3 id="案例2：销售团队-客户订单跟进与数据自动同步"><a href="#案例2：销售团队-客户订单跟进与数据自动同步" class="headerlink" title="案例2：销售团队-客户订单跟进与数据自动同步"></a>案例2：销售团队-客户订单跟进与数据自动同步</h3><p><strong>场景痛点</strong>：销售日常需跟进大量客户订单，订单信息分散在微信聊天、报价单、合同文档中，手动同步到订单表格易出错，客户跟进提醒不及时，丢单风险高。</p><p><strong>实操流程</strong>：</p><ol><li>团队在腾讯文档搭建「销售订单管理」智能表格，关联客户档案、报价单、合同文档</li><li>销售通过微信WorkBuddy小程序下达指令：「记录XX客户XX产品订单，今天已达成共识，订单金额10万元，预计4月20日付款，对接人XX，联系方式XX，同步关联对应报价单和合同文档，设置付款前3天跟进提醒」</li><li>WorkBuddy自动将信息写入腾讯文档智能表格，自动关联相关文档，到期自动触发跟进提醒，每周自动生成个人&#x2F;团队销售业绩汇总报告。</li><li>管理人员可实时在腾讯文档中查看全团队订单进度，无需销售手动提报。</li></ol><p><strong>落地效果</strong>：</p><ul><li>订单信息录入耗时从10分钟&#x2F;单压缩至1分钟语音指令，录入错误率清零</li><li>客户订单跟进遗漏率降至0，回款及时率提升40%</li><li>销售数据实时同步，团队业绩统计效率提升80%，无需手动汇总报表。</li></ul><h3 id="案例3：行政-HR-批量入职通知与员工档案自动归档"><a href="#案例3：行政-HR-批量入职通知与员工档案自动归档" class="headerlink" title="案例3：行政&#x2F;HR-批量入职通知与员工档案自动归档"></a>案例3：行政&#x2F;HR-批量入职通知与员工档案自动归档</h3><p><strong>场景痛点</strong>：批量新员工入职时，需手动发送入职通知、整理员工档案、创建个人学习文档，重复操作多，单次批量处理需3小时以上，易出现信息错误、遗漏。</p><p><strong>实操流程</strong>：</p><ol><li>HR在腾讯文档创建「新员工入职名单」智能表格，包含员工姓名、岗位、入职时间、联系方式等信息，搭建员工档案知识库</li><li>在WorkBuddy下达指令：「读取腾讯文档里的新员工入职名单，给每位员工生成定制化入职通知，包含入职时间、所需材料、办公地址、对接人信息；同时为每位员工创建个人入职档案文档，包含入职须知、岗位手册、学习清单，归档到腾讯文档「员工档案」文件夹，命名格式：姓名-岗位-入职档案」</li><li>WorkBuddy自动批量执行，100份入职通知与档案文档最快5分钟即可全部完成。</li></ol><p><strong>落地效果</strong>：</p><ul><li>100人批量入职处理耗时从3小时压缩至5分钟，效率提升97%</li><li>员工信息零错误、零遗漏，所有档案自动归档到腾讯文档，权限分级管理，安全可控</li><li>新员工入职文档可直接分享，实时协同编辑，大幅降低HR重复工作量。</li></ul><hr><h2 id="参考资料"><a href="#参考资料" class="headerlink" title="参考资料"></a>参考资料</h2><ul><li><a href="https://skillhub.cn/skills/tencent-docs">SkillHub - 腾讯文档技能</a></li><li><a href="https://docs.qq.com/open/document/mcp/">腾讯文档 MCP 官方文档</a></li></ul>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/05/workbuddy-tencent-docs-integration/</id>
    <link href="https://iyangjialin.github.io/2026/05/05/workbuddy-tencent-docs-integration/"/>
    <published>2026-05-05T11:00:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="WorkBuddy接入腾讯文档上线-「资料库」功能"><a href="#WorkBuddy接入腾讯文档上线-「资料库」功能" class="headerlink" title="WorkBuddy接入腾讯文档上线 「资料库」功能"></a>WorkBuddy接入腾讯文档上线 「资料库」功能</h1><p>WorkBuddy 上线全新「资料库」能力，首期深度嵌入「腾讯文档」，打造无缝衔接的知识工作台，成为行业首个与主流文档&#x2F;知识库产品深度集成的 AI 办公智能体。</p>
<p>现在开始，你腾讯文档里的所有资料，都可以直接在 WorkBuddy 里调用，动动手指「<strong>取 → 用 → 存</strong>」文件：</p>
<ol>
<li>左侧”资料库-腾讯文档”，选中特定文档给WorkBuddy  </li>
<li>下指令让 WorkBuddy 直接改 🤖  </li>
<li>保存&#x2F;另存为到腾讯文档 💾</li>
</ol>
<p>不用下载、不用上传、不用反复切换应用！形成完整的知识生产闭环 ✅</p>
<p>📲 <strong>手机也能用！</strong><br>这套体验WorkBuddy小程序端同步支持，随时随地接住你的灵感！</p>
<p>WorkBuddy 资料库能力上线，打通个人知识管理的最后一公里 🚀<br>快来体验吧～！</p>
<hr>
<h1 id="腾讯文档-MCP-技能使用指南（V1-0-32）"><a href="#腾讯文档-MCP-技能使用指南（V1-0-32）" class="headerlink" title="腾讯文档 MCP 技能使用指南（V1.0.32）"></a>腾讯文档 MCP 技能使用指南（V1.0.32）</h1><p>腾讯文档MCP技能是对接腾讯在线云文档平台（docs.qq.com）的标准化操作工具，覆盖文档全生命周期管理，是处理「新建&#x2F;编辑&#x2F;读取&#x2F;搜索&#x2F;管理腾讯文档」相关操作的首选工具。</p>]]>
    </summary>
    <title>WorkBuddy接入腾讯文档上线 - 资料库功能详解</title>
    <updated>2026-05-04T22:58:41.327Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="开发工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E5%BC%80%E5%8F%91%E5%B7%A5%E5%85%B7/"/>
    <category term="DeepSeek" scheme="https://iyangjialin.github.io/tags/DeepSeek/"/>
    <category term="AI编程" scheme="https://iyangjialin.github.io/tags/AI%E7%BC%96%E7%A8%8B/"/>
    <category term="终端工具" scheme="https://iyangjialin.github.io/tags/%E7%BB%88%E7%AB%AF%E5%B7%A5%E5%85%B7/"/>
    <category term="Coding Agent" scheme="https://iyangjialin.github.io/tags/Coding-Agent/"/>
    <category term="Rust" scheme="https://iyangjialin.github.io/tags/Rust/"/>
    <content>
      <![CDATA[<p><strong>DeepSeek-TUI</strong> 是一款终端原生的 AI 编码智能体，基于 Rust 开发，专为 DeepSeek V4 系列大模型打造。它完全运行在终端环境中，可直接读写文件、执行 Shell 命令、网页搜索、Git 管理、调度子智能体，基于 ratatui 框架构建了全键盘驱动的高速交互界面。</p><span id="more"></span><hr><h2 id="一、核心差异化特性"><a href="#一、核心差异化特性" class="headerlink" title="一、核心差异化特性"></a>一、核心差异化特性</h2><p>与浏览器端 AI 助手、通用聊天前端不同，DeepSeek-TUI 专为代码优先的工作流设计，AI 可直接操作文件系统、终端和 Git 历史。</p><h3 id="1-实时思维链流式展示"><a href="#1-实时思维链流式展示" class="headerlink" title="1. 实时思维链流式展示"></a>1. 实时思维链流式展示</h3><p>可实时输出模型的思考过程，支持 3 档推理强度（<code>off</code> → <code>high</code> → <code>max</code>），会话中随时可通过 <code>Shift+Tab</code> 切换，平衡推理深度与响应速度。</p><h3 id="2-全工具套件真实执行权限"><a href="#2-全工具套件真实执行权限" class="headerlink" title="2. 全工具套件真实执行权限"></a>2. 全工具套件真实执行权限</h3><p>不只是建议命令，可直接执行。内置工具覆盖：</p><ul><li>文件读写&#x2F;编辑</li><li>Shell 命令执行</li><li>Git 操作</li><li>网页搜索、URL 抓取（含 PDF 提取）</li><li>补丁应用（<code>apply-patch</code>）</li><li>子智能体生成</li><li>MCP 协议对接</li></ul><p>所有工具调用默认需用户审批，完全可控。</p><h3 id="3-智能上下文管理"><a href="#3-智能上下文管理" class="headerlink" title="3. 智能上下文管理"></a>3. 智能上下文管理</h3><p>适配 DeepSeek V4 系列 <strong>1M token 上下文窗口</strong>，可投喂完整代码库；上下文满额时自动执行压缩策略，无需手动裁剪。</p><h3 id="4-多档交互模式"><a href="#4-多档交互模式" class="headerlink" title="4. 多档交互模式"></a>4. 多档交互模式</h3><p>按 <code>Tab</code> 可循环切换，覆盖从只读调研到全自动执行的全场景需求：</p><table><thead><tr><th>模式</th><th>说明</th></tr></thead><tbody><tr><td><strong>Plan</strong></td><td>只读调研模式，仅可读取文件、查看信息，无修改&#x2F;执行权限</td></tr><tr><td><strong>Agent</strong></td><td>默认交互模式，所有操作需用户审批，安全可控</td></tr><tr><td><strong>YOLO</strong></td><td>自动审批执行模式，无需用户确认即可执行所有操作</td></tr><tr><td><strong>Hetun（河豚）</strong></td><td>通过递归子智能体并行完成任务调研与拆解</td></tr></tbody></table><hr><h2 id="二、完整核心功能清单"><a href="#二、完整核心功能清单" class="headerlink" title="二、完整核心功能清单"></a>二、完整核心功能清单</h2><table><thead><tr><th>功能模块</th><th>核心说明</th></tr></thead><tbody><tr><td>思维链流式展示</td><td>实时呈现 DeepSeek 的思考推理过程</td></tr><tr><td>全工具套件</td><td>支持文件操作、Shell、Git、网页搜索、PDF 提取、补丁应用、子智能体、MCP 协议</td></tr><tr><td>1M token 上下文</td><td>支持完整代码库投喂，上下文满额自动智能压缩</td></tr><tr><td>多交互模式</td><td>Plan（只读调研）、Agent（审批制交互）、YOLO（自动审批执行）、Hetun（并行子智能体任务拆解）</td></tr><tr><td>会话保存&#x2F;恢复</td><td>支持长会话断点续传、对话分叉</td></tr><tr><td>HTTP&#x2F;SSE 运行时 API</td><td>支持 <code>deepseek serve --http</code> 启动无头智能体工作流</td></tr><tr><td>MCP 协议兼容</td><td>可对接模型上下文协议服务器，扩展工具能力</td></tr><tr><td>实时成本追踪</td><td>单轮与会话级别的 token 用量、成本预估</td></tr><tr><td>主题切换</td><td>支持深浅色主题，DeepSeek 品牌蓝色调色板</td></tr><tr><td>macOS 沙箱</td><td>基于 Seatbelt 的沙箱配置，限制文件写入权限</td></tr></tbody></table><hr><h2 id="三、架构与仓库结构"><a href="#三、架构与仓库结构" class="headerlink" title="三、架构与仓库结构"></a>三、架构与仓库结构</h2><p>项目采用 Cargo 工作空间组织，包含 12+ 个职责单一的 crates，遵循分层架构（上层依赖下层，反向不可依赖）。</p><table><thead><tr><th>Crate 路径</th><th>包名</th><th>核心职责</th></tr></thead><tbody><tr><td><code>crates/cli</code></td><td>deepseek-cli</td><td>CLI 入口、参数解析、命令路由</td></tr><tr><td><code>crates/tui</code></td><td>deepseek-tui</td><td>完整终端 UI、引擎运行时、工具执行、流式处理、会话管理（当前核心运行时）</td></tr><tr><td><code>crates/app-server</code></td><td>deepseek-app-server</td><td>基于 axum 的 HTTP&#x2F;SSE 运行时 API 服务</td></tr><tr><td><code>crates/core</code></td><td>deepseek-core</td><td>智能体循环编排、会话与轮次管理</td></tr><tr><td><code>crates/agent</code></td><td>deepseek-agent</td><td>模型&#x2F;服务商注册与降级策略</td></tr><tr><td><code>crates/tools</code></td><td>deepseek-tools</td><td>工具调用生命周期、Schema 校验、调度并行性</td></tr><tr><td><code>crates/config</code></td><td>deepseek-config</td><td>配置加载、配置文件、环境变量解析</td></tr><tr><td><code>crates/state</code></td><td>deepseek-state</td><td>基于 SQLite 的会话&#x2F;线程持久化与恢复</td></tr><tr><td><code>crates/execpolicy</code></td><td>deepseek-execpolicy</td><td>沙箱&#x2F;审批决策的执行策略引擎</td></tr></tbody></table><blockquote><p><strong>注</strong>：当前 <code>crates/tui</code> 是终端用户的核心运行时，其余 crates 正在逐步拆分抽离。二次开发可优先从 <code>crates/tui/src/</code> 入手。</p></blockquote><h3 id="分层架构"><a href="#分层架构" class="headerlink" title="分层架构"></a>分层架构</h3><p>整体遵循 <strong>Dispatcher → TUI → Engine → Tools</strong> 分层模式：</p><ol><li><strong>Dispatcher</strong>：<code>deepseek</code> CLI 二进制为轻量级调度器，解析子命令后委托给 <code>deepseek-tui</code> 二进制处理交互式会话</li><li><strong>TUI 层</strong>：基于 <code>ratatui</code> 构建终端界面，负责用户交互</li><li><strong>Engine 层</strong>：异步执行代理循环，管理会话状态、轮次追踪、持久化任务队列；对接 OpenAI 兼容的 Chat Completions 流式客户端</li><li><strong>Tools 层</strong>：类型化工具注册表，分发执行文件、Shell、Git、Web、MCP 等操作</li></ol><hr><h2 id="四、支持模型与定价"><a href="#四、支持模型与定价" class="headerlink" title="四、支持模型与定价"></a>四、支持模型与定价</h2><p>默认适配 DeepSeek V4 模型家族，支持 NVIDIA NIM 托管变体。</p><table><thead><tr><th>模型</th><th>上下文窗口</th><th>输入（缓存命中）</th><th>输入（缓存未命中）</th><th>输出</th></tr></thead><tbody><tr><td><code>deepseek-v4-pro</code></td><td>1M</td><td>$0.03625 &#x2F; 1M token</td><td>$0.435 &#x2F; 1M token</td><td>$0.87 &#x2F; 1M token</td></tr><tr><td><code>deepseek-v4-flash</code></td><td>1M</td><td>$0.028 &#x2F; 1M token</td><td>$0.14 &#x2F; 1M token</td><td>$0.28 &#x2F; 1M token</td></tr></tbody></table><blockquote><p><strong>注</strong>：<code>deepseek-v4-pro</code> 定价为限时 75% 折扣价，有效期至 <strong>2026-05-05</strong>；NVIDIA NIM 变体按 NVIDIA 账户条款计费，不产生 DeepSeek 平台账单。</p></blockquote><hr><h2 id="五、快速安装与启动"><a href="#五、快速安装与启动" class="headerlink" title="五、快速安装与启动"></a>五、快速安装与启动</h2><h3 id="方式-1：npm-安装（推荐）"><a href="#方式-1：npm-安装（推荐）" class="headerlink" title="方式 1：npm 安装（推荐）"></a>方式 1：npm 安装（推荐）</h3><p>自动从 GitHub Release 下载预编译二进制文件：</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 全局安装</span></span><br><span class="line">npm install -g deepseek-tui</span><br><span class="line"></span><br><span class="line"><span class="comment"># 启动</span></span><br><span class="line">deepseek</span><br></pre></td></tr></table></figure><h3 id="方式-2：Cargo-源码编译安装（需-Rust-1-85-）"><a href="#方式-2：Cargo-源码编译安装（需-Rust-1-85-）" class="headerlink" title="方式 2：Cargo 源码编译安装（需 Rust 1.85+）"></a>方式 2：Cargo 源码编译安装（需 Rust 1.85+）</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 安装 deepseek CLI</span></span><br><span class="line">cargo install deepseek-tui-cli --locked</span><br><span class="line"></span><br><span class="line"><span class="comment"># 安装 deepseek-tui 命令</span></span><br><span class="line">cargo install deepseek-tui --locked</span><br></pre></td></tr></table></figure><h3 id="Linux-ARM64-适配（树莓派、Asahi、Graviton-等）"><a href="#Linux-ARM64-适配（树莓派、Asahi、Graviton-等）" class="headerlink" title="Linux ARM64 适配（树莓派、Asahi、Graviton 等）"></a>Linux ARM64 适配（树莓派、Asahi、Graviton 等）</h3><ul><li>v0.8.8+ 版本可直接用 <code>npm i -g deepseek-tui</code>（glibc 环境）</li><li>旧版本&#x2F;特殊环境可通过 Rust 构建</li></ul><h3 id="首次启动配置"><a href="#首次启动配置" class="headerlink" title="首次启动配置"></a>首次启动配置</h3><p>首次运行会提示输入 DeepSeek API Key，也可通过以下方式配置：</p><ul><li>环境变量：<code>DEEPSEEK_API_KEY</code></li><li>命令行：<code>deepseek login</code></li></ul><hr><h2 id="六、扩展子系统"><a href="#六、扩展子系统" class="headerlink" title="六、扩展子系统"></a>六、扩展子系统</h2><h3 id="LSP-子系统"><a href="#LSP-子系统" class="headerlink" title="LSP 子系统"></a>LSP 子系统</h3><p>启动 <code>rust-analyzer</code>&#x2F;<code>pyright</code> 等语言服务器，提供代码编辑后的诊断能力，并将错误注入模型上下文。</p><h3 id="RLM-子系统"><a href="#RLM-子系统" class="headerlink" title="RLM 子系统"></a>RLM 子系统</h3><p>沙箱化 Python REPL，支持批量分类、子 LLM 编排。</p><hr><h2 id="七、适用场景"><a href="#七、适用场景" class="headerlink" title="七、适用场景"></a>七、适用场景</h2><p>DeepSeek-TUI 旨在成为开发者命令行中的 AI 结对编程伙伴，尤其适合：</p><ul><li><strong>长时间、复杂交互的编码任务</strong></li><li><strong>需要完整代码库上下文的项目分析</strong></li><li><strong>希望 AI 直接执行操作而非仅提供建议的开发者</strong></li><li><strong>需要实时查看 AI 推理过程的场景</strong></li></ul><hr><h2 id="相关链接"><a href="#相关链接" class="headerlink" title="相关链接"></a>相关链接</h2><ul><li><strong>GitHub 仓库</strong>：<a href="https://github.com/Hmbown/DeepSeek-TUI">https://github.com/Hmbown/DeepSeek-TUI</a></li><li><strong>中文文档</strong>：<a href="https://zread.ai/Hmbown/DeepSeek-TUI">https://zread.ai/Hmbown/DeepSeek-TUI</a></li><li><strong>DeepSeek 平台</strong>：<a href="https://platform.deepseek.com/">https://platform.deepseek.com</a></li></ul><hr><p><em>最后更新：2026-05-05</em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/05/deepseek-tui-complete-analysis/</id>
    <link href="https://iyangjialin.github.io/2026/05/05/deepseek-tui-complete-analysis/"/>
    <published>2026-05-05T10:45:00.000Z</published>
    <summary>
      <![CDATA[<p><strong>DeepSeek-TUI</strong> 是一款终端原生的 AI 编码智能体，基于 Rust 开发，专为 DeepSeek V4 系列大模型打造。它完全运行在终端环境中，可直接读写文件、执行 Shell 命令、网页搜索、Git 管理、调度子智能体，基于 ratatui 框架构建了全键盘驱动的高速交互界面。</p>]]>
    </summary>
    <title>DeepSeek-TUI 完全解析：终端原生 AI 编码智能体</title>
    <updated>2026-05-04T22:29:01.060Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="数据分析" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/"/>
    <category term="SkillHub" scheme="https://iyangjialin.github.io/tags/SkillHub/"/>
    <category term="Claude Code" scheme="https://iyangjialin.github.io/tags/Claude-Code/"/>
    <category term="AI技能" scheme="https://iyangjialin.github.io/tags/AI%E6%8A%80%E8%83%BD/"/>
    <category term="数据分析" scheme="https://iyangjialin.github.io/tags/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/"/>
    <category term="工具评测" scheme="https://iyangjialin.github.io/tags/%E5%B7%A5%E5%85%B7%E8%AF%84%E6%B5%8B/"/>
    <content>
      <![CDATA[<blockquote><p>📅 研究报告生成时间: 2026-05-05 06:10:00<br>🌐 数据来源: SkillHub (<a href="https://skillhub.cn/">https://skillhub.cn</a>)<br>🤖 研究方法: 使用 playwright-cli 自动化提取技能页面信息<br>📊 技能总数: 22 个<br>🔍 研究深度: 详细信息（包含描述、版本、下载量、安全检测等）</p></blockquote><p>SkillHub 作为 AI 智能体技能的核心社区，汇聚了来自 ClawHub 和用户上传的各类技能。本报告通过自动化工具深度抓取了 22 个技能的完整数据，从下载量、收藏数、安全检测等多个维度进行定量分析，为你揭示哪些技能真正值得安装。</p><span id="more"></span><hr><h2 id="📊-概览统计"><a href="#📊-概览统计" class="headerlink" title="📊 概览统计"></a>📊 概览统计</h2><table><thead><tr><th>指标</th><th>数值</th></tr></thead><tbody><tr><td><strong>技能总数</strong></td><td>22 个</td></tr><tr><td><strong>ClawHub 来源</strong></td><td>21 个 (95.5%)</td></tr><tr><td><strong>用户上传</strong></td><td>1 个 (4.5%)</td></tr><tr><td><strong>总下载量</strong></td><td>约 334.8 万次</td></tr><tr><td><strong>总收藏数</strong></td><td>约 11314 次</td></tr></tbody></table><hr><h2 id="🔒-安全检测统计"><a href="#🔒-安全检测统计" class="headerlink" title="🔒 安全检测统计"></a>🔒 安全检测统计</h2><p>SkillHub 对技能进行双重安全检测（科恩实验室 + 云鼎实验室）。检测结果分布如下：</p><table><thead><tr><th>安全等级</th><th>技能数量</th></tr></thead><tbody><tr><td><strong>安全无风险</strong></td><td>20 个技能</td></tr><tr><td><strong>可疑（潜在风险）</strong></td><td>1 个技能 ⚠️</td></tr><tr><td><strong>未检测</strong></td><td>1 个技能</td></tr></tbody></table><blockquote><p><strong>说明</strong>: 部分技能可能在一个检测中被评为”可疑”，需谨慎使用。建议安装前使用 Skill Vetter 技能进行二次审查。</p></blockquote><hr><h2 id="📚-技能详细说明"><a href="#📚-技能详细说明" class="headerlink" title="📚 技能详细说明"></a>📚 技能详细说明</h2><p>以下是所有 22 个技能的详细信息，按字母顺序排列。</p><h3 id="1-Agent-Browser-agent-browser"><a href="#1-Agent-Browser-agent-browser" class="headerlink" title="1. Agent Browser (agent-browser)"></a>1. Agent Browser (agent-browser)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>agent-browser</code></td></tr><tr><td>作者</td><td>thesethrose</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>0.2.0</td></tr><tr><td>下载量</td><td>24.8万</td></tr><tr><td>收藏数</td><td>679</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>基于 Rust 的快速无头浏览器自动化 CLI，支持 Node.js 回退，允许 AI 代理通过结构化命令执行页面导航、点击、输入和快照操作。</p><p><strong>📖 文档章节</strong></p><ul><li>Browser Automation with agent-browser</li><li>Installation</li><li>npm recommended</li><li>From Source</li><li>Quick start</li></ul><hr><h3 id="2-Agent-Browser-ClawdBot-agent-browser-clawdbot"><a href="#2-Agent-Browser-ClawdBot-agent-browser-clawdbot" class="headerlink" title="2. Agent Browser ClawdBot (agent-browser-clawdbot)"></a>2. Agent Browser ClawdBot (agent-browser-clawdbot)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>agent-browser-clawdbot</code></td></tr><tr><td>作者</td><td>matrixy</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>0.1.0</td></tr><tr><td>下载量</td><td>10.2万</td></tr><tr><td>收藏数</td><td>368</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>专为 AI 智能体优化的无头浏览器自动化 CLI，支持无障碍树快照和基于引用的元素选择。</p><p><strong>📖 文档章节</strong></p><ul><li>Agent Browser Skill</li><li>Why Use This Over Built-in Browser Tool</li><li>Core Workflow</li><li>Key Commands</li><li>Navigation</li></ul><hr><h3 id="3-Agent-Memory-agent-memory"><a href="#3-Agent-Memory-agent-memory" class="headerlink" title="3. Agent Memory (agent-memory)"></a>3. Agent Memory (agent-memory)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>agent-memory</code></td></tr><tr><td>作者</td><td>dennis-da-menace</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.0</td></tr><tr><td>下载量</td><td>6.7万</td></tr><tr><td>收藏数</td><td>48</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>为 AI 智能体提供持久记忆，用于跨会话存储事实、从行动中学习、回忆信息及追踪实体。</p><hr><h3 id="4-Auto-Updater-Skill-auto-updater"><a href="#4-Auto-Updater-Skill-auto-updater" class="headerlink" title="4. Auto-Updater Skill (auto-updater)"></a>4. Auto-Updater Skill (auto-updater)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>auto-updater</code></td></tr><tr><td>作者</td><td>maximeprades</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.0</td></tr><tr><td>下载量</td><td>8.8万</td></tr><tr><td>收藏数</td><td>393</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>每日自动更新 Clawdbot 及所有已安装技能。运行 cron 检查更新并应用，同时向用户发送变更摘要。</p><p><strong>📖 文档章节</strong></p><ul><li>Auto-Updater Skill</li><li>What It Does</li><li>Setup</li><li>Quick Start</li><li>Configuration Options</li></ul><hr><h3 id="5-Automation-Workflows-automation-workflows"><a href="#5-Automation-Workflows-automation-workflows" class="headerlink" title="5. Automation Workflows (automation-workflows)"></a>5. Automation Workflows (automation-workflows)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>automation-workflows</code></td></tr><tr><td>作者</td><td>jk-0001</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>0.1.0</td></tr><tr><td>下载量</td><td>7.1万</td></tr><tr><td>收藏数</td><td>275</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>设计和实施自动化工作流，帮助个体创业者节省时间并扩展业务。用于识别可自动化的重复性任务、跨工具构建工作流、设置触发器和操作，或优化现有自动化。涵盖自动化机会识别、工作流设计、工具选择（Zapier、Make、n8n）、测试及维护。</p><hr><h3 id="6-Desktop-Control-desktop-control"><a href="#6-Desktop-Control-desktop-control" class="headerlink" title="6. Desktop Control (desktop-control)"></a>6. Desktop Control (desktop-control)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>desktop-control</code></td></tr><tr><td>作者</td><td>matagul</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.0</td></tr><tr><td>下载量</td><td>5.1万</td></tr><tr><td>收藏数</td><td>326</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>具备鼠标、键盘和屏幕控制的高级桌面自动化能力。</p><p><strong>📖 文档章节</strong></p><ul><li>Desktop Control Skill</li><li>🎯 Features</li><li>Mouse Control</li><li>Keyboard Control</li><li>Screen Operations</li></ul><hr><h3 id="7-Excel-XLSX-excel-xlsx"><a href="#7-Excel-XLSX-excel-xlsx" class="headerlink" title="7. Excel &#x2F; XLSX (excel-xlsx)"></a>7. Excel &#x2F; XLSX (excel-xlsx)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>excel-xlsx</code></td></tr><tr><td>作者</td><td>ivangavila</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.2</td></tr><tr><td>下载量</td><td>9.8万</td></tr><tr><td>收藏数</td><td>308</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>创建、检查和编辑 Microsoft Excel 电子表格及 XLSX 文件，支持公式、格式化、数据验证、图表、透视表及数据分析功能。</p><hr><h3 id="8-Find-Skills-find-skills"><a href="#8-Find-Skills-find-skills" class="headerlink" title="8. Find Skills (find-skills)"></a>8. Find Skills (find-skills)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>find-skills</code></td></tr><tr><td>作者</td><td>jimluxinghai</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>0.1.0</td></tr><tr><td>下载量</td><td>40.2万</td></tr><tr><td>收藏数</td><td>1.1千</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>当用户询问”如何做某事”、”寻找某技能”或希望扩展功能时，帮助发现并安装智能体技能。适用于寻找可安装功能的场景。</p><hr><h3 id="9-Github-github"><a href="#9-Github-github" class="headerlink" title="9. Github (github)"></a>9. Github (github)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>github</code></td></tr><tr><td>作者</td><td>steipete</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.0</td></tr><tr><td>下载量</td><td>26.6万</td></tr><tr><td>收藏数</td><td>561</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>使用 <code>gh</code> CLI 与 GitHub 交互，通过 <code>gh issue</code>、<code>gh pr</code>、<code>gh run</code> 和 <code>gh api</code> 管理议题、PR、CI 运行及高级查询。</p><hr><h3 id="10-Humanizer-humanizer"><a href="#10-Humanizer-humanizer" class="headerlink" title="10. Humanizer (humanizer)"></a>10. Humanizer (humanizer)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>humanizer</code></td></tr><tr><td>作者</td><td>biostartechnology</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.0</td></tr><tr><td>下载量</td><td>14.9万</td></tr><tr><td>收藏数</td><td>584</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>消除 AI 写作痕迹，使文本更自然真实。基于维基百科”AI 写作特征”指南，识别并修正夸张象征、宣传用语、肤浅-ing 分析、模糊归因、破折号滥用、三项排比、AI 词汇、负面平行结构及冗长连接词等模式。</p><hr><h3 id="11-Markdown-Converter-markdown-converter"><a href="#11-Markdown-Converter-markdown-converter" class="headerlink" title="11. Markdown Converter (markdown-converter)"></a>11. Markdown Converter (markdown-converter)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>markdown-converter</code></td></tr><tr><td>作者</td><td>steipete</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.0</td></tr><tr><td>下载量</td><td>4.5万</td></tr><tr><td>收藏数</td><td>171</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>使用 markitdown 将文档和文件转换为 Markdown。用于将 PDF、Word (.docx)、PowerPoint (.pptx)、Excel (.xlsx, .xls)、HTML、CSV、JSON、XML、图片（含 EXIF&#x2F;OCR）、音频（含转录）、ZIP 压缩包、YouTube 链接或 EPub 转换为 Markdown 格式，以进行 LLM 处理或文本分析。</p><hr><h3 id="12-Mcporter-mcporter"><a href="#12-Mcporter-mcporter" class="headerlink" title="12. Mcporter (mcporter)"></a>12. Mcporter (mcporter)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>mcporter</code></td></tr><tr><td>作者</td><td>steipete</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.0</td></tr><tr><td>下载量</td><td>6.0万</td></tr><tr><td>收藏数</td><td>183</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>使用 mcporter CLI 直接列出、配置、认证及调用 MCP 服务器&#x2F;工具（支持 HTTP 或 stdio），涵盖临时服务器、配置编辑及 CLI&#x2F;类型生成功能。</p><hr><h3 id="13-Obsidian-obsidian"><a href="#13-Obsidian-obsidian" class="headerlink" title="13. Obsidian (obsidian)"></a>13. Obsidian (obsidian)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>obsidian</code></td></tr><tr><td>来源</td><td>用户上传</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>与 Obsidian 笔记应用集成，支持笔记创建、编辑、链接管理、标签组织和知识图谱构建。适用于个人知识管理和第二大脑搭建。</p><hr><h3 id="14-Pdf-pdf"><a href="#14-Pdf-pdf" class="headerlink" title="14. Pdf (pdf)"></a>14. Pdf (pdf)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>pdf</code></td></tr><tr><td>作者</td><td>awspace</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>0.1.0</td></tr><tr><td>下载量</td><td>3.3万</td></tr><tr><td>收藏数</td><td>51</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>全面的 PDF 处理工具包，支持提取文本和表格、创建新 PDF、合并&#x2F;拆分文档及表单填写。Claude 需要大规模程序化处理、生成或分析 PDF 时使用。</p><hr><h3 id="15-Powerpoint-PPTX-powerpoint-pptx"><a href="#15-Powerpoint-PPTX-powerpoint-pptx" class="headerlink" title="15. Powerpoint &#x2F; PPTX (powerpoint-pptx)"></a>15. Powerpoint &#x2F; PPTX (powerpoint-pptx)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>powerpoint-pptx</code></td></tr><tr><td>作者</td><td>ivangavila</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.1</td></tr><tr><td>下载量</td><td>4.1万</td></tr><tr><td>收藏数</td><td>118</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>创建、检查和编辑 Microsoft PowerPoint 演示文稿及 PPTX 文件，支持可靠的布局、模板、占位符、备注、图表和视觉质检。</p><hr><h3 id="16-Self-Improving-Agent-self-improving-agent"><a href="#16-Self-Improving-Agent-self-improving-agent" class="headerlink" title="16. Self-Improving Agent (self-improving-agent)"></a>16. Self-Improving Agent (self-improving-agent)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>self-improving-agent</code></td></tr><tr><td>作者</td><td>pskoett</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>3.0.21</td></tr><tr><td>下载量</td><td>56.7万</td></tr><tr><td>收藏数</td><td>3.4千</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>捕获经验教训、错误和纠正，以实现持续改进。使用时机：（1）命令或操作意外失败；（2）用户纠正 AI 的输出；（3）用户请求缺失的功能；（4）API&#x2F;外部工具失败；（5）知识过时；（6）发现更好的方法。</p><p><strong>📖 文档章节</strong></p><ul><li>Self-Improvement Skill</li><li>First-Use Initialisation</li><li>Quick Reference</li><li>OpenClaw Setup (Recommended)</li><li>Installation</li><li>Workspace Structure</li><li>Create Learning Files</li><li>Promotion Targets</li><li>Inter-Session Communication</li><li>Logging Format</li></ul><hr><h3 id="17-Skill-Creator-skill-creator"><a href="#17-Skill-Creator-skill-creator" class="headerlink" title="17. Skill Creator (skill-creator)"></a>17. Skill Creator (skill-creator)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>skill-creator</code></td></tr><tr><td>作者</td><td>chinden</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>0.1.0</td></tr><tr><td>下载量</td><td>7.9万</td></tr><tr><td>收藏数</td><td>277</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>创建有效技能指南。当用户希望创建新技能（或更新现有技能）以利用专业知识、工作流程或工具集成扩展 Claude 的能力时，应使用此技能。</p><hr><h3 id="18-Skill-Vetter-skill-vetter"><a href="#18-Skill-Vetter-skill-vetter" class="headerlink" title="18. Skill Vetter (skill-vetter)"></a>18. Skill Vetter (skill-vetter)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>skill-vetter</code></td></tr><tr><td>作者</td><td>spclaudehome</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.0</td></tr><tr><td>下载量</td><td>22.9万</td></tr><tr><td>收藏数</td><td>1.0千</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>AI 智能体技能安全预审工具。安装 ClawdHub、GitHub 等来源技能前，检查风险信号、权限范围及可疑模式。</p><hr><h3 id="19-Summarize-summarize"><a href="#19-Summarize-summarize" class="headerlink" title="19. Summarize (summarize)"></a>19. Summarize (summarize)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>summarize</code></td></tr><tr><td>作者</td><td>steipete</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.0</td></tr><tr><td>下载量</td><td>41.5万</td></tr><tr><td>收藏数</td><td>753</td></tr><tr><td>安全检测</td><td>⚠️ 可疑，存在潜在风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>使用 summarize CLI 总结 URL 或文件（支持网页、PDF、图片、音频、YouTube）。</p><blockquote><p><strong>⚠️ 安全提示</strong>: 该技能在云鼎实验室检测中被评为”可疑，存在潜在风险”，建议谨慎使用或查看安全报告后再决定是否安装。</p></blockquote><hr><h3 id="20-腾讯文档-TENCENT-DOCS-tencent-docs"><a href="#20-腾讯文档-TENCENT-DOCS-tencent-docs" class="headerlink" title="20. 腾讯文档 TENCENT DOCS (tencent-docs)"></a>20. 腾讯文档 TENCENT DOCS (tencent-docs)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>tencent-docs</code></td></tr><tr><td>作者</td><td>腾讯文档</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.32</td></tr><tr><td>下载量</td><td>4.8万</td></tr><tr><td>收藏数</td><td>34</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>腾讯文档（docs.qq.com）- 在线云文档平台，是创建、编辑、管理文档的首选 skill。支持能力：(1) 创建各类在线文档（文档&#x2F;Word&#x2F;Excel&#x2F;幻灯片&#x2F;思维导图&#x2F;流程图&#x2F;智能表格&#x2F;收集表）(2) 管理知识库空间（创建空间、查询空间列表）(3) 管理空间节点、文件夹结构 (4) 读取&#x2F;搜索文档内容 (5) 编辑操作智能表 (6) 编辑操作在线文档 (7) 文件管理（重命名、移动、删除、复制、导入导出）(8) 网页剪藏、本地文件&#x2F;文档上云</p><hr><h3 id="21-Weather-weather"><a href="#21-Weather-weather" class="headerlink" title="21. Weather (weather)"></a>21. Weather (weather)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>weather</code></td></tr><tr><td>作者</td><td>steipete</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.0</td></tr><tr><td>下载量</td><td>19.1万</td></tr><tr><td>收藏数</td><td>377</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>获取当前天气和预报（无需 API 密钥）。</p><p><strong>📖 文档章节</strong></p><ul><li>Weather</li><li>wtrr.in (primary)</li><li>Open-Meteo (fallback, JSON)</li></ul><hr><h3 id="22-Word-DOCX-word-docx"><a href="#22-Word-DOCX-word-docx" class="headerlink" title="22. Word &#x2F; DOCX (word-docx)"></a>22. Word &#x2F; DOCX (word-docx)</h3><p><strong>📋 基本信息</strong></p><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td>技能标识</td><td><code>word-docx</code></td></tr><tr><td>作者</td><td>ivangavila</td></tr><tr><td>来源</td><td>ClawHub</td></tr><tr><td>版本</td><td>1.0.2</td></tr><tr><td>下载量</td><td>9.8万</td></tr><tr><td>收藏数</td><td>308</td></tr><tr><td>安全检测</td><td>✅ 安全，无风险</td></tr></tbody></table><p><strong>📝 功能描述</strong></p><p>创建、检查和编辑 Microsoft Word 文档及 DOCX 文件，支持样式、编号、修订记录、表格、分节符及兼容性检查等功能。</p><hr><h2 id="📊-下载量排行-TOP-10"><a href="#📊-下载量排行-TOP-10" class="headerlink" title="📊 下载量排行 TOP 10"></a>📊 下载量排行 TOP 10</h2><table><thead><tr><th>排名</th><th>技能名称</th><th>下载量</th></tr></thead><tbody><tr><td>🥇</td><td><strong>Self-Improving Agent</strong></td><td>56.7万次</td></tr><tr><td>🥈</td><td><strong>Summarize</strong></td><td>41.5万次</td></tr><tr><td>🥉</td><td><strong>Find Skills</strong></td><td>40.2万次</td></tr><tr><td>4</td><td><strong>GitHub</strong></td><td>26.6万次</td></tr><tr><td>5</td><td><strong>Agent Browser</strong></td><td>24.8万次</td></tr><tr><td>6</td><td><strong>Skill Vetter</strong></td><td>22.9万次</td></tr><tr><td>7</td><td><strong>Weather</strong></td><td>19.1万次</td></tr><tr><td>8</td><td><strong>Humanizer</strong></td><td>14.9万次</td></tr><tr><td>9</td><td><strong>Agent Browser ClawdBot</strong></td><td>10.2万次</td></tr><tr><td>10</td><td><strong>Excel &#x2F; XLSX</strong></td><td>9.8万次</td></tr></tbody></table><hr><h2 id="📊-收藏数排行-TOP-10"><a href="#📊-收藏数排行-TOP-10" class="headerlink" title="📊 收藏数排行 TOP 10"></a>📊 收藏数排行 TOP 10</h2><table><thead><tr><th>排名</th><th>技能名称</th><th>收藏数</th></tr></thead><tbody><tr><td>🥇</td><td><strong>Self-Improving Agent</strong></td><td>3.4千</td></tr><tr><td>🥈</td><td><strong>Find Skills</strong></td><td>1.1千</td></tr><tr><td>🥉</td><td><strong>Skill Vetter</strong></td><td>1.0千</td></tr><tr><td>4</td><td><strong>Summarize</strong></td><td>753</td></tr><tr><td>5</td><td><strong>GitHub</strong></td><td>561</td></tr><tr><td>6</td><td><strong>Humanizer</strong></td><td>584</td></tr><tr><td>7</td><td><strong>Agent Browser</strong></td><td>679</td></tr><tr><td>8</td><td><strong>Skill Creator</strong></td><td>277</td></tr><tr><td>9</td><td><strong>Automation Workflows</strong></td><td>275</td></tr><tr><td>10</td><td><strong>Word &#x2F; DOCX</strong></td><td>308</td></tr></tbody></table><hr><h2 id="💡-使用建议"><a href="#💡-使用建议" class="headerlink" title="💡 使用建议"></a>💡 使用建议</h2><ol><li><strong>优先选择 ClawHub 来源的技能</strong> — 经过社区验证，质量较高</li><li><strong>注意安全检测评级</strong> — 避免”或有潜在风险”的技能，除非你已审查代码</li><li><strong>查看下载量和收藏数</strong> — 高下载量通常意味着更好的兼容性和稳定性</li><li><strong>阅读完整文档</strong> — 每个技能页面都包含详细的使用说明和示例</li><li><strong>定期更新技能</strong> — 使用 auto-updater 技能可以自动保持技能最新</li><li><strong>安装前使用 Skill Vetter</strong> — 对未知来源的技能进行安全预审</li></ol><hr><h2 id="📖-研究方法说明"><a href="#📖-研究方法说明" class="headerlink" title="📖 研究方法说明"></a>📖 研究方法说明</h2><p>本研究报告使用以下方法生成：</p><ol><li><strong>自动化数据收集</strong>: 使用 playwright-cli 工具自动访问 SkillHub 上的 22 个技能页面</li><li><strong>结构化信息提取</strong>: 从页面的可访问性树中提取关键信息（名称、描述、版本、下载量等）</li><li><strong>数据验证</strong>: 交叉验证多个数据源，确保信息准确性</li><li><strong>报告生成</strong>: 将结构化数据转换为易读的 Markdown 格式</li></ol><p><strong>工具链</strong>:</p><ul><li><code>playwright-cli</code> — 浏览器自动化</li><li><code>python3</code> — 数据处理和报告生成</li><li><code>bash</code> — 自动化脚本</li></ul><hr><p><em>报告生成时间: 2026-05-05 06:10:00</em><br><em>研究报告版本: v3.0 (最终版)</em><br><em>数据来源: SkillHub (<a href="https://skillhub.cn/">https://skillhub.cn</a>)</em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/05/skillhub-research-report/</id>
    <link href="https://iyangjialin.github.io/2026/05/05/skillhub-research-report/"/>
    <published>2026-05-05T10:30:00.000Z</published>
    <summary>
      <![CDATA[<blockquote>
<p>📅 研究报告生成时间: 2026-05-05 06:10:00<br>🌐 数据来源: SkillHub (<a href="https://skillhub.cn/">https://skillhub.cn</a>)<br>🤖 研究方法: 使用 playwright-cli 自动化提取技能页面信息<br>📊 技能总数: 22 个<br>🔍 研究深度: 详细信息（包含描述、版本、下载量、安全检测等）</p>
</blockquote>
<p>SkillHub 作为 AI 智能体技能的核心社区，汇聚了来自 ClawHub 和用户上传的各类技能。本报告通过自动化工具深度抓取了 22 个技能的完整数据，从下载量、收藏数、安全检测等多个维度进行定量分析，为你揭示哪些技能真正值得安装。</p>]]>
    </summary>
    <title>SkillHub 深度研究报告：22 个 AI 技能完整数据分析</title>
    <updated>2026-05-04T22:23:37.283Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="工具评测" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E5%B7%A5%E5%85%B7%E8%AF%84%E6%B5%8B/"/>
    <category term="SkillHub" scheme="https://iyangjialin.github.io/tags/SkillHub/"/>
    <category term="Claude Code" scheme="https://iyangjialin.github.io/tags/Claude-Code/"/>
    <category term="AI技能" scheme="https://iyangjialin.github.io/tags/AI%E6%8A%80%E8%83%BD/"/>
    <category term="工具评测" scheme="https://iyangjialin.github.io/tags/%E5%B7%A5%E5%85%B7%E8%AF%84%E6%B5%8B/"/>
    <content>
      <![CDATA[<h1 id="SkillHub-技能清单：21-个-AI-智能体技能全解析"><a href="#SkillHub-技能清单：21-个-AI-智能体技能全解析" class="headerlink" title="SkillHub 技能清单：21 个 AI 智能体技能全解析"></a>SkillHub 技能清单：21 个 AI 智能体技能全解析</h1><blockquote><p>来源：<a href="https://skillhub.cn/">SkillHub 中文社区</a> — 专为中国用户优化的 Skills 社区（2026-05-05 整理）</p></blockquote><p>SkillHub 技能覆盖了从 AI 写作优化、浏览器自动化、记忆管理、工作流设计到文档处理、天气查询等全方位功能。这些技能共同构成了一个完整的 AI 助手能力生态系统。</p><span id="more"></span><hr><h2 id="技能分类总览"><a href="#技能分类总览" class="headerlink" title="技能分类总览"></a>技能分类总览</h2><table><thead><tr><th>类别</th><th>包含技能</th></tr></thead><tbody><tr><td><strong>基础工具类</strong></td><td>Weather、Summarize、Find Skills</td></tr><tr><td><strong>自动化类</strong></td><td>Agent Browser、Desktop Control、Automation Workflows</td></tr><tr><td><strong>文档处理类</strong></td><td>Word&#x2F;DOCX、Excel&#x2F;XLSX、PowerPoint&#x2F;PPTX、PDF、Markdown Converter</td></tr><tr><td><strong>开发工具类</strong></td><td>GitHub、MCPorter、Obsidian</td></tr><tr><td><strong>AI 增强类</strong></td><td>Humanizer、Self-Improving Agent、Agent Memory、Auto-Updater</td></tr><tr><td><strong>安全与管理类</strong></td><td>Skill Vetter、Skill Creator</td></tr><tr><td><strong>云服务集成</strong></td><td>Tencent Docs</td></tr></tbody></table><hr><h2 id="1-Self-Improving-Agent"><a href="#1-Self-Improving-Agent" class="headerlink" title="1. Self-Improving Agent"></a>1. Self-Improving Agent</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/self-improving-agent">skillhub.cn&#x2F;skills&#x2F;self-improving-agent</a></p><p>捕获经验教训、错误和纠正，实现跨会话持续改进。AI 犯过的错误不再重蹈覆辙。</p><h3 id="核心机制"><a href="#核心机制" class="headerlink" title="核心机制"></a>核心机制</h3><table><thead><tr><th>情形</th><th>操作</th></tr></thead><tbody><tr><td>命令&#x2F;操作失败</td><td>记录到 <code>.learnings/ERRORS.md</code></td></tr><tr><td>用户纠正</td><td>记录到 <code>.learnings/LEARNINGS.md</code>（category: correction）</td></tr><tr><td>用户需要缺失功能</td><td>记录到 <code>.learnings/FEATURE_REQUESTS.md</code></td></tr><tr><td>API&#x2F;外部工具失败</td><td>记录到 <code>.learnings/ERRORS.md</code>（含集成细节）</td></tr><tr><td>知识过时</td><td>记录到 <code>.learnings/LEARNINGS.md</code>（category: knowledge_gap）</td></tr><tr><td>发现更优方案</td><td>记录到 <code>.learnings/LEARNINGS.md</code>（category: best_practice）</td></tr></tbody></table><h3 id="晋升目标"><a href="#晋升目标" class="headerlink" title="晋升目标"></a>晋升目标</h3><table><thead><tr><th>目标文件</th><th>适用内容</th></tr></thead><tbody><tr><td><code>SOUL.md</code></td><td>行为模式、沟通风格</td></tr><tr><td><code>AGENTS.md</code></td><td>工作流改进</td></tr><tr><td><code>TOOLS.md</code></td><td>工具使用技巧</td></tr><tr><td><code>CLAUDE.md</code></td><td>项目事实、约定、坑点</td></tr><tr><td><code>.github/copilot-instructions.md</code></td><td>GitHub Copilot 项目上下文</td></tr></tbody></table><h3 id="优先级与领域标签"><a href="#优先级与领域标签" class="headerlink" title="优先级与领域标签"></a>优先级与领域标签</h3><ul><li><strong>优先级</strong>：critical &#x2F; high &#x2F; medium &#x2F; low</li><li><strong>领域</strong>：frontend &#x2F; backend &#x2F; infra &#x2F; tests &#x2F; docs &#x2F; config</li></ul><hr><h2 id="2-Summarize"><a href="#2-Summarize" class="headerlink" title="2. Summarize"></a>2. Summarize</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/summarize">skillhub.cn&#x2F;skills&#x2F;summarize</a></p><p>使用 <code>summarize</code> CLI 总结 URL 或文件，支持网页、PDF、图片、音频、YouTube 视频。</p><h3 id="支持格式"><a href="#支持格式" class="headerlink" title="支持格式"></a>支持格式</h3><ul><li>网页（URL）</li><li>PDF 文件</li><li>图片（OCR）</li><li>音频文件</li><li>YouTube 视频</li></ul><h3 id="核心配置"><a href="#核心配置" class="headerlink" title="核心配置"></a>核心配置</h3><ul><li><strong>模型 + Keys</strong>：支持多种模型，需配置 API Key</li><li><strong>常用标志</strong>：支持定制输出格式和长度</li></ul><hr><h2 id="3-Find-Skills"><a href="#3-Find-Skills" class="headerlink" title="3. Find Skills"></a>3. Find Skills</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/find-skills">skillhub.cn&#x2F;skills&#x2F;find-skills</a></p><p>当用户询问”如何做某事”、”寻找某技能”或希望扩展功能时，帮助发现并安装智能体技能。</p><h3 id="工作流"><a href="#工作流" class="headerlink" title="工作流"></a>工作流</h3><ol><li>理解需求（领域 + 任务）</li><li><code>skillhub search &lt;query&gt;</code> 搜索</li><li>若无匹配则 <code>clawhub search &lt;query&gt;</code> 回退</li><li>向用户呈现选项并提供安装命令</li></ol><hr><h2 id="4-GitHub"><a href="#4-GitHub" class="headerlink" title="4. GitHub"></a>4. GitHub</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/github">skillhub.cn&#x2F;skills&#x2F;github</a></p><p>使用 <code>gh</code> CLI 与 GitHub 交互，支持 Issue、PR、Run 和 API 高级查询。</p><h3 id="核心能力"><a href="#核心能力" class="headerlink" title="核心能力"></a>核心能力</h3><ul><li><strong>Pull Requests</strong>：<code>gh pr</code> 查看、创建、管理 PR</li><li><strong>Issues</strong>：<code>gh issue</code> 追踪问题</li><li><strong>Actions</strong>：<code>gh run</code> 查看 CI&#x2F;CD 运行状态</li><li><strong>API 高级查询</strong>：处理复杂数据需求</li></ul><hr><h2 id="5-Agent-Browser（Rust-版）"><a href="#5-Agent-Browser（Rust-版）" class="headerlink" title="5. Agent Browser（Rust 版）"></a>5. Agent Browser（Rust 版）</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/agent-browser">skillhub.cn&#x2F;skills&#x2F;agent-browser</a></p><p>基于 Rust 的快速无头浏览器自动化 CLI，支持 Node.js 回退，允许 AI 代理通过结构化命令自动化浏览器操作。</p><h3 id="安装"><a href="#安装" class="headerlink" title="安装"></a>安装</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">npm install -g agent-browser</span><br><span class="line">agent-browser install</span><br></pre></td></tr></table></figure><h3 id="核心命令"><a href="#核心命令" class="headerlink" title="核心命令"></a>核心命令</h3><table><thead><tr><th>命令</th><th>说明</th></tr></thead><tbody><tr><td><code>agent-browser open &lt;url&gt;</code></td><td>导航到指定 URL</td></tr><tr><td><code>agent-browser snapshot -i --json</code></td><td>获取可交互元素快照</td></tr><tr><td><code>agent-browser click @e2</code></td><td>点击指定元素</td></tr><tr><td><code>agent-browser fill @e3 &quot;text&quot;</code></td><td>填写表单字段</td></tr><tr><td><code>agent-browser screenshot page.png</code></td><td>页面截图&#x2F;PDF</td></tr></tbody></table><hr><h2 id="6-Skill-Vetter"><a href="#6-Skill-Vetter" class="headerlink" title="6. Skill Vetter"></a>6. Skill Vetter</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/skill-vetter">skillhub.cn&#x2F;skills&#x2F;skill-vetter</a></p><p>AI 智能体技能安全预审工具。安装 ClawdHub、GitHub 等来源技能前，检查风险信号、权限范围和可疑模式。</p><h3 id="审核协议"><a href="#审核协议" class="headerlink" title="审核协议"></a>审核协议</h3><ul><li><strong>检查内容</strong>：权限范围、数据访问、文件系统操作、网络请求</li><li><strong>风险信号</strong>：危险权限、敏感数据处理、不明依赖</li><li><strong>适用场景</strong>：安装前审核、已知技能复审</li></ul><hr><h2 id="7-Weather"><a href="#7-Weather" class="headerlink" title="7. Weather"></a>7. Weather</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/weather">skillhub.cn&#x2F;skills&#x2F;weather</a></p><p>获取当前天气和预报，<strong>无需 API 密钥</strong>。数据来源支持 wttr.in（主站）和 Open-Meteo（备用）。</p><h3 id="数据源"><a href="#数据源" class="headerlink" title="数据源"></a>数据源</h3><table><thead><tr><th>源</th><th>说明</th></tr></thead><tbody><tr><td>wttr.in</td><td>主数据源，无需密钥</td></tr><tr><td>Open-Meteo</td><td>JSON 格式备用源</td></tr></tbody></table><hr><h2 id="8-Humanizer"><a href="#8-Humanizer" class="headerlink" title="8. Humanizer"></a>8. Humanizer</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/humanizer">skillhub.cn&#x2F;skills&#x2F;humanizer</a></p><p>消除 AI 写作痕迹，使文本更自然真实。基于维基百科”AI 写作特征”指南，识别并修正夸张象征、宣传用语、肤浅过渡等模式。</p><h3 id="核心修正"><a href="#核心修正" class="headerlink" title="核心修正"></a>核心修正</h3><ul><li><strong>人格与灵魂</strong>：添加真实声音，避免无灵魂的干净文本</li><li><strong>内容模式</strong>：消除不必要的重要性强调、宽泛宣言、虚假平衡</li><li><strong>风格</strong>：打破”首先……其次……最后”等机械结构</li></ul><hr><h2 id="9-Word-DOCX"><a href="#9-Word-DOCX" class="headerlink" title="9. Word &#x2F; DOCX"></a>9. Word &#x2F; DOCX</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/word-docx">skillhub.cn&#x2F;skills&#x2F;word-docx</a></p><p>创建、检查和编辑 Microsoft Word 文档及 DOCX 文件，支持样式、编号、修订记录、页眉页脚等完整功能。</p><h3 id="核心规则"><a href="#核心规则" class="headerlink" title="核心规则"></a>核心规则</h3><ol><li>将 DOCX 视为 OOXML，而非纯文本</li><li>样式和直接格式需精确保留</li><li>列表和编号是独立系统</li><li>页面布局存在于 sections 中</li><li>修订、批注和字段需精确编辑</li><li>交付前验证往返兼容性</li></ol><hr><h2 id="10-Excel-XLSX"><a href="#10-Excel-XLSX" class="headerlink" title="10. Excel &#x2F; XLSX"></a>10. Excel &#x2F; XLSX</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/excel-xlsx">skillhub.cn&#x2F;skills&#x2F;excel-xlsx</a></p><p>创建、检查和编辑 Microsoft Excel 工作簿及 XLSX 文件，支持可靠的公式、日期处理、数据类型保护。</p><h3 id="核心规则-1"><a href="#核心规则-1" class="headerlink" title="核心规则"></a>核心规则</h3><ol><li>根据任务选择工作流，而非习惯</li><li>日期是带有遗留怪癖的序列号</li><li>保持计算在 Excel 中以维持工作簿活性</li><li>在 Excel 破坏数据前保护数据类型</li><li>更改内容前保留工作簿结构</li><li>重新计算后再交付</li></ol><hr><h2 id="11-PowerPoint-PPTX"><a href="#11-PowerPoint-PPTX" class="headerlink" title="11. PowerPoint &#x2F; PPTX"></a>11. PowerPoint &#x2F; PPTX</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/powerpoint-ptx">skillhub.cn&#x2F;skills&#x2F;powerpoint-ptx</a></p><p>创建、检查和编辑 Microsoft PowerPoint 演示文稿及 PPTX 文件，支持幻灯片、动画、备注等。</p><h3 id="核心规则-2"><a href="#核心规则-2" class="headerlink" title="核心规则"></a>核心规则</h3><ol><li>选择工作流前先了解任务</li><li>理解幻灯片母版和布局继承</li><li>动画和过渡需精确控制</li><li>备注与幻灯片内容分开管理</li></ol><hr><h2 id="12-PDF"><a href="#12-PDF" class="headerlink" title="12. PDF"></a>12. PDF</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/pdf">skillhub.cn&#x2F;skills&#x2F;pdf</a></p><p>全面的 PDF 处理工具包，支持提取文本和表格、创建新 PDF、合并&#x2F;拆分文档及表单填写。</p><h3 id="支持场景"><a href="#支持场景" class="headerlink" title="支持场景"></a>支持场景</h3><ul><li>文本&#x2F;表格提取</li><li>新 PDF 创建</li><li>合并与拆分</li><li>表单填写</li><li>大规模程序化处理</li></ul><hr><h2 id="13-Obsidian"><a href="#13-Obsidian" class="headerlink" title="13. Obsidian"></a>13. Obsidian</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/obsidian">skillhub.cn&#x2F;skills&#x2F;obsidian</a></p><p>操作 Obsidian 仓库（纯 Markdown 笔记）并通过 obsidian-cli 自动化。适用于知识管理、笔记整理、第二大脑搭建。</p><h3 id="核心命令-1"><a href="#核心命令-1" class="headerlink" title="核心命令"></a>核心命令</h3><ul><li>查找活跃的保险库（vault）</li><li><code>obsidian-cli quick start</code> 快速上手</li><li>笔记创建、搜索、标签管理</li></ul><hr><h2 id="14-Skill-Creator"><a href="#14-Skill-Creator" class="headerlink" title="14. Skill Creator"></a>14. Skill Creator</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/skill-creator">skillhub.cn&#x2F;skills&#x2F;skill-creator</a></p><p>创建有效技能指南。当用户希望创建新技能（或更新现有技能）以利用专业知识、工作流程或工具时使用。</p><h3 id="技能价值"><a href="#技能价值" class="headerlink" title="技能价值"></a>技能价值</h3><ul><li><strong>结构化指令</strong>：将专业知识转化为 AI 可执行的步骤</li><li><strong>工具集成</strong>：封装工具调用和工作流</li><li><strong>场景覆盖</strong>：特定领域任务的完整指南</li></ul><hr><h2 id="15-Automation-Workflows"><a href="#15-Automation-Workflows" class="headerlink" title="15. Automation Workflows"></a>15. Automation Workflows</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/automation-workflows">skillhub.cn&#x2F;skills&#x2F;automation-workflows</a></p><p>设计和实施自动化工作流，帮助个体创业者节省时间并扩展业务。</p><h3 id="工作流-1"><a href="#工作流-1" class="headerlink" title="工作流"></a>工作流</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line">Step 1：识别可自动化的任务</span><br><span class="line">Step 2：设计工作流步骤</span><br><span class="line">Step 3：实施与测试</span><br><span class="line">Step 4：监控和优化</span><br></pre></td></tr></table></figure><hr><h2 id="16-MCPorter"><a href="#16-MCPorter" class="headerlink" title="16. MCPorter"></a>16. MCPorter</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/mcporter">skillhub.cn&#x2F;skills&#x2F;mcporter</a></p><p>使用 <code>mcporter</code> CLI 直接列出、配置、认证及调用 MCP 服务器&#x2F;工具（支持 HTTP 或 stdio）。</p><h3 id="核心能力-1"><a href="#核心能力-1" class="headerlink" title="核心能力"></a>核心能力</h3><ul><li>列出可用 MCP 服务器</li><li>配置认证信息</li><li>调用工具并处理响应</li><li>CLI&#x2F;type 生成</li></ul><hr><h2 id="17-Agent-Browser（OpenClaw-版）"><a href="#17-Agent-Browser（OpenClaw-版）" class="headerlink" title="17. Agent Browser（OpenClaw 版）"></a>17. Agent Browser（OpenClaw 版）</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/agent-browser-clawdbot">skillhub.cn&#x2F;skills&#x2F;agent-browser-clawdbot</a></p><p>专为 AI 智能体优化的无头浏览器自动化 CLI，支持无障碍树快照和基于引用的元素选择，OpenClaw 集成版。</p><h3 id="优势"><a href="#优势" class="headerlink" title="优势"></a>优势</h3><table><thead><tr><th>特性</th><th>说明</th></tr></thead><tbody><tr><td>确定性元素选择</td><td>通过 ref 引用而非坐标</td></tr><tr><td>无障碍树快照</td><td>完整可访问性信息</td></tr><tr><td>多会话隔离</td><td>支持并发浏览器上下文</td></tr><tr><td>状态保存</td><td>跳过登录流程</td></tr></tbody></table><h3 id="核心命令-2"><a href="#核心命令-2" class="headerlink" title="核心命令"></a>核心命令</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line">agent-browser open &lt;url&gt;</span><br><span class="line">agent-browser snapshot -i --json</span><br><span class="line">agent-browser click @e2</span><br><span class="line">agent-browser fill @e3 <span class="string">&quot;text&quot;</span></span><br><span class="line">agent-browser <span class="built_in">wait</span> --load networkidle</span><br></pre></td></tr></table></figure><hr><h2 id="18-Desktop-Control"><a href="#18-Desktop-Control" class="headerlink" title="18. Desktop Control"></a>18. Desktop Control</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/desktop-control">skillhub.cn&#x2F;skills&#x2F;desktop-control</a></p><p>具备鼠标、键盘和屏幕控制的高级桌面自动化技能。</p><h3 id="功能"><a href="#功能" class="headerlink" title="功能"></a>功能</h3><ul><li><strong>鼠标控制</strong>：移动、点击、拖拽</li><li><strong>键盘控制</strong>：按键、组合键、文字输入</li><li><strong>屏幕控制</strong>：截图、视觉检测、区域识别</li></ul><hr><h2 id="19-Markdown-Converter"><a href="#19-Markdown-Converter" class="headerlink" title="19. Markdown Converter"></a>19. Markdown Converter</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/markdown-converter">skillhub.cn&#x2F;skills&#x2F;markdown-converter</a></p><p>使用 <code>markitdown</code> 将各类文档和文件转换为 Markdown 格式。</p><h3 id="支持格式-1"><a href="#支持格式-1" class="headerlink" title="支持格式"></a>支持格式</h3><ul><li>Word (.docx)</li><li>Excel (.xlsx)</li><li>PowerPoint (.pptx)</li><li>PDF</li><li>HTML</li><li>其他文档格式</li></ul><hr><h2 id="20-Agent-Memory"><a href="#20-Agent-Memory" class="headerlink" title="20. Agent Memory"></a>20. Agent Memory</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/agent-memory">skillhub.cn&#x2F;skills&#x2F;agent-memory</a></p><p>为 AI 智能体提供持久记忆，用于跨会话存储事实、从行动中学习、回忆信息及追踪实体。</p><h3 id="功能-1"><a href="#功能-1" class="headerlink" title="功能"></a>功能</h3><ul><li>跨会话持久化事实存储</li><li>从历史行动中学习</li><li>实体追踪</li><li>语义检索</li></ul><hr><h2 id="21-Auto-Updater"><a href="#21-Auto-Updater" class="headerlink" title="21. Auto-Updater"></a>21. Auto-Updater</h2><p><strong>链接</strong>：<a href="https://skillhub.cn/skills/auto-updater">skillhub.cn&#x2F;skills&#x2F;auto-updater</a></p><p>每日自动更新 Clawdbot 及所有已安装技能。运行 cron 检查更新并发送更新摘要到主会话。</p><h3 id="配置选项"><a href="#配置选项" class="headerlink" title="配置选项"></a>配置选项</h3><table><thead><tr><th>选项</th><th>默认值</th><th>说明</th></tr></thead><tbody><tr><td>Time</td><td>4:00 AM</td><td>运行更新时间</td></tr><tr><td>Timezone</td><td>System default</td><td>时区</td></tr><tr><td>Delivery</td><td>Main session</td><td>摘要投递位置</td></tr></tbody></table><h3 id="功能-2"><a href="#功能-2" class="headerlink" title="功能"></a>功能</h3><ul><li>Clawdbot 本身自动更新</li><li>所有已安装技能更新</li><li>生成更新摘要报告</li><li>手动命令支持</li></ul><hr><h2 id="安装命令汇总"><a href="#安装命令汇总" class="headerlink" title="安装命令汇总"></a>安装命令汇总</h2><p>以上所有技能均可通过以下命令安装：</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">skillhub install &lt;slug&gt;</span><br></pre></td></tr></table></figure><h3 id="常用安装示例"><a href="#常用安装示例" class="headerlink" title="常用安装示例"></a>常用安装示例</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br></pre></td><td class="code"><pre><span class="line">skillhub install self-improving-agent</span><br><span class="line">skillhub install summarize</span><br><span class="line">skillhub install find-skills</span><br><span class="line">skillhub install github</span><br><span class="line">skillhub install agent-browser</span><br><span class="line">skillhub install skill-vetter</span><br><span class="line">skillhub install weather</span><br><span class="line">skillhub install humanizer</span><br><span class="line">skillhub install word-docx</span><br><span class="line">skillhub install excel-xlsx</span><br><span class="line">skillhub install powerpoint-ptx</span><br><span class="line">skillhub install pdf</span><br><span class="line">skillhub install obsidian</span><br><span class="line">skillhub install skill-creator</span><br><span class="line">skillhub install automation-workflows</span><br><span class="line">skillhub install mcporter</span><br><span class="line">skillhub install agent-browser-clawdbot</span><br><span class="line">skillhub install desktop-control</span><br><span class="line">skillhub install markdown-converter</span><br><span class="line">skillhub install agent-memory</span><br><span class="line">skillhub install auto-updater</span><br></pre></td></tr></table></figure><hr><p><em>最后更新：2026-05-05</em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/05/skillhub-skills-catalog/</id>
    <link href="https://iyangjialin.github.io/2026/05/05/skillhub-skills-catalog/"/>
    <published>2026-05-05T00:30:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="SkillHub-技能清单：21-个-AI-智能体技能全解析"><a href="#SkillHub-技能清单：21-个-AI-智能体技能全解析" class="headerlink" title="SkillHub 技能清单：21 个 AI 智能体技能全解析"></a>SkillHub 技能清单：21 个 AI 智能体技能全解析</h1><blockquote>
<p>来源：<a href="https://skillhub.cn/">SkillHub 中文社区</a> — 专为中国用户优化的 Skills 社区（2026-05-05 整理）</p>
</blockquote>
<p>SkillHub 技能覆盖了从 AI 写作优化、浏览器自动化、记忆管理、工作流设计到文档处理、天气查询等全方位功能。这些技能共同构成了一个完整的 AI 助手能力生态系统。</p>]]>
    </summary>
    <title>SkillHub 技能清单：21 个 AI 智能体技能全解析</title>
    <updated>2026-05-04T22:14:44.526Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="工具评测" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E5%B7%A5%E5%85%B7%E8%AF%84%E6%B5%8B/"/>
    <category term="Claude Code" scheme="https://iyangjialin.github.io/tags/Claude-Code/"/>
    <category term="工具对比" scheme="https://iyangjialin.github.io/tags/%E5%B7%A5%E5%85%B7%E5%AF%B9%E6%AF%94/"/>
    <category term="AI工程化" scheme="https://iyangjialin.github.io/tags/AI%E5%B7%A5%E7%A8%8B%E5%8C%96/"/>
    <category term="Superpowers" scheme="https://iyangjialin.github.io/tags/Superpowers/"/>
    <category term="Compound Engineering" scheme="https://iyangjialin.github.io/tags/Compound-Engineering/"/>
    <category term="Everything-Claude-Code" scheme="https://iyangjialin.github.io/tags/Everything-Claude-Code/"/>
    <content>
      <![CDATA[<h1 id="Claude-Code-三大工程化工具横评"><a href="#Claude-Code-三大工程化工具横评" class="headerlink" title="Claude Code 三大工程化工具横评"></a>Claude Code 三大工程化工具横评</h1><p>三者均为 Claude Code 生态的顶级增强工具，但<strong>核心定位、解决的问题、适用场景完全不同</strong>，并非同质化竞品，而是可互补协同的工程化套件。</p><span id="more"></span><hr><h2 id="通俗类比"><a href="#通俗类比" class="headerlink" title="通俗类比"></a>通俗类比</h2><table><thead><tr><th>工具</th><th>类比</th><th>核心定位</th></tr></thead><tbody><tr><td><strong>Superpowers</strong></td><td>给 AI 编程套上<strong>标准化工程纪律与流程护栏</strong>的操作手册</td><td>AI 开发的「纪律系统」</td></tr><tr><td><strong>Compound Engineering</strong></td><td>在规范流程基础上，新增<strong>知识复利沉淀</strong>的成长型工程体系</td><td>AI 开发的「成长体系」</td></tr><tr><td><strong>Everything-Claude-Code</strong></td><td>给 Claude Code 一键装上的<strong>全功能、开箱即用的顶配改装套件</strong></td><td>一站式「能力大礼包」</td></tr></tbody></table><hr><h2 id="核心维度对比总表"><a href="#核心维度对比总表" class="headerlink" title="核心维度对比总表"></a>核心维度对比总表</h2><table><thead><tr><th align="left">对比维度</th><th align="left">Superpowers</th><th align="left">Compound Engineering</th><th align="left">Everything-Claude-Code</th></tr></thead><tbody><tr><td align="left"><strong>核心定位</strong></td><td align="left">强约束软件工程方法论框架，AI开发的「纪律系统」</td><td align="left">带知识复利的完整工程闭环，AI开发的「成长体系」</td><td align="left">Claude Code全栈增强配置集合，一站式「能力大礼包」</td></tr><tr><td align="left"><strong>核心理念</strong></td><td align="left">Process over Prompt（流程大于提示词），让AI守规矩而非更聪明</td><td align="left">让工程效率实现复利增长，每一次开发都让AI更懂你的项目</td><td align="left">把Claude Code从聊天工具变成可深度定制的Agent编排平台</td></tr><tr><td align="left"><strong>核心工作流</strong></td><td align="left">头脑风暴→规划→执行→审查，四步闭环，全流程强制校验</td><td align="left">计划→执行→审查→复合（沉淀），在标准流程基础上新增知识沉淀环节</td><td align="left">无固定单一流线，覆盖从需求、开发、测试、安全到运维全生命周期的模块化能力</td></tr><tr><td align="left"><strong>核心能力</strong></td><td align="left">15+可组合Skills，强制TDD、系统化调试、子代理隔离开发</td><td align="left">24个专业Agent、16个专属命令、11项核心技能，核心是经验召回与知识复用</td><td align="left">48个专家子代理、183个Skills、79条快捷命令，配套Hooks、MCP、安全防护</td></tr><tr><td align="left"><strong>适用人群</strong></td><td align="left">追求工程规范的个人&#x2F;团队，复杂业务项目、长期维护的代码库</td><td align="left">长期迭代项目的开发者&#x2F;团队，需要沉淀技术资产、复用项目经验</td><td align="left">所有Claude Code用户，新手快速上手、全场景能力覆盖需求</td></tr><tr><td align="left"><strong>核心优势</strong></td><td align="left">生态最成熟（170k+ Stars），流程经过海量项目验证，跨平台兼容性极强</td><td align="left">唯一聚焦「知识复利」的工具，完美补全经验沉淀环节</td><td align="left">体量最大、能力最全，一键安装即可获得社区沉淀的几乎所有高阶玩法</td></tr><tr><td align="left"><strong>核心短板</strong></td><td align="left">缺少跨会话的知识沉淀能力，对一次性小项目流程偏繁琐</td><td align="left">社区体量远小于另外两者，单独使用流程完整性不如Superpowers</td><td align="left">体量过大，全量安装有功能冗余，无强统一流程约束</td></tr><tr><td align="left"><strong>生态兼容性</strong></td><td align="left">全平台兼容（Claude Code、Cursor、Codex、Copilot等）</td><td align="left">原生适配Claude Code，同时支持转换为其他平台插件格式</td><td align="left">原生仅适配Claude Code，其他平台兼容性弱</td></tr><tr><td align="left"><strong>支持平台数</strong></td><td align="left">7个</td><td align="left"><strong>11个</strong></td><td align="left">5个</td></tr></tbody></table><hr><h2 id="各工具深度解析"><a href="#各工具深度解析" class="headerlink" title="各工具深度解析"></a>各工具深度解析</h2><h3 id="1-Superpowers：AI编程的「工程纪律法典」"><a href="#1-Superpowers：AI编程的「工程纪律法典」" class="headerlink" title="1. Superpowers：AI编程的「工程纪律法典」"></a>1. Superpowers：AI编程的「工程纪律法典」</h3><p>Superpowers 是 Claude 生态最顶流的工作流框架，核心解决的是 <strong>AI 原生的「即兴编码」问题」</strong>——AI 拿到需求就直接写代码，跳过需求澄清、架构设计、测试验证等关键环节。</p><blockquote><p><strong>核心机制</strong>：</p><ul><li>把工业级软件工程最佳实践，拆解成可组合的 Skills 和强制执行的铁律</li><li>TDD 的「红-绿-重构」循环，调试必须先做根因分析</li><li>3次修复失败自动触发架构评审</li><li>子代理隔离 + Git Worktree 隔离，每个任务委派独立子代理</li></ul></blockquote><p><strong>典型使用</strong>：</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br></pre></td><td class="code"><pre><span class="line">/brainstorming   <span class="comment"># 厘清需求</span></span><br><span class="line">/write-plan      <span class="comment"># 拆解2-5分钟可完成的最小任务</span></span><br><span class="line">/execute-plan    <span class="comment"># 带检查点执行，全程自动触发代码审查和测试验证</span></span><br></pre></td></tr></table></figure><h3 id="2-Compound-Engineering：带复利增长的「成长型工程体系」"><a href="#2-Compound-Engineering：带复利增长的「成长型工程体系」" class="headerlink" title="2. Compound Engineering：带复利增长的「成长型工程体系」"></a>2. Compound Engineering：带复利增长的「成长型工程体系」</h3><p>CE 完全继承了 Superpowers 的标准化流程，核心突破是补全了 <strong>AI 开发缺失的「学习沉淀」环节</strong>，核心理念是「与其让技术债越滚越大，不如让知识复利越积越多」。</p><blockquote><p><strong>核心灵魂</strong>：<code>/compound</code> 命令</p><ul><li>每次开发完成后，强制把成功模式、踩坑经验、项目特有规范、架构设计决策系统地文档化</li><li>转化为 AI 可识别、可召回的可复用知识</li><li>配套 <code>/learn</code> 和 <code>/recall</code> 命令，AI 可以主动学习你的代码库规范</li></ul></blockquote><p><strong>解决的痛点</strong>：</p><ul><li>团队新人接手项目不用再反复问「代码为什么这么写」</li><li>长期迭代项目不会陷入「改一个 bug 埋三个 bug」的死亡螺旋</li></ul><h3 id="3-Everything-Claude-Code：Claude-Code-的「一站式顶配改装包」"><a href="#3-Everything-Claude-Code：Claude-Code-的「一站式顶配改装包」" class="headerlink" title="3. Everything-Claude-Code：Claude Code 的「一站式顶配改装包」"></a>3. Everything-Claude-Code：Claude Code 的「一站式顶配改装包」</h3><p>ECC 不是单一的工作流框架，而是一套<strong>经过生产环境验证的、完整的 Claude Code 增强配置集合</strong>，由 Anthropic 黑客马拉松冠军基于 10 个月高强度实战沉淀而来。</p><blockquote><p><strong>六大核心组件</strong>：</p><ul><li>48 个专业 Agents（架构师、安全审计员、测试工程师等）</li><li>183 个 Skills（覆盖全技术栈）</li><li>79 条快捷命令</li><li>15+ 事件 Hooks</li><li>12 种语言 Rules</li><li>6+ MCP 服务配置</li></ul></blockquote><p><strong>核心价值</strong>：开箱即用，无需用户从零开始调教 Claude Code，一键安装就能获得社区沉淀的几乎所有高阶玩法。</p><hr><h2 id="功能矩阵详细对比"><a href="#功能矩阵详细对比" class="headerlink" title="功能矩阵详细对比"></a>功能矩阵详细对比</h2><table><thead><tr><th>功能维度</th><th>Compound Engineering</th><th>Superpowers</th><th>Everything Claude Code</th></tr></thead><tbody><tr><td><strong>核心开发工作流</strong></td><td>Brainstorm→Plan→Work→Review→Compound 全流程复利循环</td><td>全流程强约束，TDD、系统化调试、子代理开发</td><td>全场景研发工作流，从需求规划到部署上线全链路</td></tr><tr><td><strong>Agent&#x2F;技能库</strong></td><td>50+ Agent（27代码评审、8研究等）、41+ Skill</td><td>14个内置技能，无独立子代理</td><td>48个垂直领域专业子代理、183个全场景 Skills</td></tr><tr><td><strong>跨平台能力</strong></td><td>行业独有单源多端，1键转10个平台原生格式</td><td>会话钩子自动检测环境，单命令完成安装</td><td>各平台专属适配层，Cursor深度兼容</td></tr><tr><td><strong>语言&#x2F;框架支持</strong></td><td>通用开发流程，无分语言专属规则</td><td>通用软件工程规范，无分语言垂直适配</td><td>12+主流编程语言全量支持</td></tr><tr><td><strong>流程约束能力</strong></td><td>引导式开发，无强制门控</td><td>强约束硬门控，Red Flags 机制</td><td>规则层全流程约束，灵活度与约束性平衡</td></tr></tbody></table><hr><h2 id="平台兼容性对比"><a href="#平台兼容性对比" class="headerlink" title="平台兼容性对比"></a>平台兼容性对比</h2><table><thead><tr><th>维度</th><th>Compound Engineering</th><th>Superpowers</th><th>Everything Claude Code</th></tr></thead><tbody><tr><td><strong>原生主平台</strong></td><td>Claude Code</td><td>Claude Code</td><td>Claude Code</td></tr><tr><td><strong>全量支持平台</strong></td><td>11个：OpenCode、Codex、Copilot、Gemini、Kiro、Windsurf、Droid、Pi、OpenClaw、Qwen 等</td><td>5个：GitHub Copilot CLI、Cursor、Gemini CLI、Codex CLI、OpenCode</td><td>3个：Cursor、OpenCode、Codex</td></tr><tr><td><strong>跨平台同步</strong></td><td>支持，一键同步到所有目标平台</td><td>无</td><td>无</td></tr><tr><td><strong>平台适配方式</strong></td><td>CLI格式转换，输出各平台原生配置</td><td>会话钩子自动检测，动态适配</td><td>各平台专属适配层</td></tr></tbody></table><hr><h2 id="生态与资源对比"><a href="#生态与资源对比" class="headerlink" title="生态与资源对比"></a>生态与资源对比</h2><table><thead><tr><th>维度</th><th>Compound Engineering</th><th>Superpowers</th><th>Everything Claude Code</th></tr></thead><tbody><tr><td><strong>开源协议</strong></td><td>开源</td><td>MIT</td><td>开源</td></tr><tr><td><strong>社区规模</strong></td><td>官方维护，无公开大规模社区数据</td><td>Discord 社区支持</td><td><strong>140k+ Stars、21k+ Fork、170+ 贡献者</strong></td></tr><tr><td><strong>文档完善度</strong></td><td>完整快速开始、安装指南、架构详解</td><td>完整多平台安装文档、架构文档</td><td>全量文档，多语言翻译，示例配置</td></tr><tr><td><strong>迭代速度</strong></td><td>稳定迭代，v2.65.0</td><td>稳定迭代，v5.0.7</td><td>高频迭代，v1.10.0（2026-04）+ ECC 2.0 Rust版</td></tr></tbody></table><hr><h2 id="适用人群总结"><a href="#适用人群总结" class="headerlink" title="适用人群总结"></a>适用人群总结</h2><table><thead><tr><th>工具</th><th>最佳适配人群</th></tr></thead><tbody><tr><td><strong>Compound Engineering</strong></td><td>需要跨多个 AI 编码工具复用工作流的开发者；注重开发经验沉淀的团队；需要 AI 开发实践与编程教学兼顾的教育场景</td></tr><tr><td><strong>Superpowers</strong></td><td>对代码质量、规范性有强要求的开发者；想落地 TDD、避免 AI 跳步的团队；编程入门者；想要轻量零依赖工具的用户</td></tr><tr><td><strong>Everything Claude Code</strong></td><td>从入门到资深的全层级开发者；企业级开发团队；深度使用 AI 辅助开发的重度用户；需要参与开源贡献的开发者</td></tr></tbody></table><hr><h2 id="最优协同方案"><a href="#最优协同方案" class="headerlink" title="最优协同方案"></a>最优协同方案</h2><p>三者并非互斥，<strong>社区最成熟的组合玩法</strong>是：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br></pre></td><td class="code"><pre><span class="line">┌─────────────────────────────────────────────────────────┐</span><br><span class="line">│  顶层：Compound Engineering                              │</span><br><span class="line">│  知识沉淀 - 把每次项目的经验教训沉淀为可复用资产         │</span><br><span class="line">├─────────────────────────────────────────────────────────┤</span><br><span class="line">│  中层：Superpowers                                       │</span><br><span class="line">│  流程护栏 - 强制所有开发遵循标准化的工程流程              │</span><br><span class="line">├─────────────────────────────────────────────────────────┤</span><br><span class="line">│  底层：Everything-Claude-Code                           │</span><br><span class="line">│  能力底座 - 一键补齐所有高阶功能，按需裁剪适配技术栈      │</span><br><span class="line">└─────────────────────────────────────────────────────────┘</span><br></pre></td></tr></table></figure><hr><h2 id="最终选型建议"><a href="#最终选型建议" class="headerlink" title="最终选型建议"></a>最终选型建议</h2><table><thead><tr><th>需求</th><th>推荐选择</th></tr></thead><tbody><tr><td>跨多个 AI 编码工具复用工作流，一次编写全平台部署</td><td><strong>Compound Engineering</strong></td></tr><tr><td>约束 AI 的编码行为，让它严格遵循 TDD 等软件工程规范</td><td><strong>Superpowers</strong></td></tr><tr><td>一站式、全场景、多语言的生产级 AI 开发体系</td><td><strong>Everything Claude Code</strong></td></tr></tbody></table><hr><blockquote><p><strong>参考链接</strong>：</p><ul><li><a href="https://github.com/EveryInc/compound-engineering-plugin">Compound Engineering Plugin</a></li><li><a href="https://github.com/obra/superpowers">Superpowers</a></li><li><a href="https://github.com/affaan-m/everything-claude-code">Everything-Claude-Code</a></li></ul></blockquote>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/04/claude-code-tools-comparison/</id>
    <link href="https://iyangjialin.github.io/2026/05/04/claude-code-tools-comparison/"/>
    <published>2026-05-04T13:10:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="Claude-Code-三大工程化工具横评"><a href="#Claude-Code-三大工程化工具横评" class="headerlink" title="Claude Code 三大工程化工具横评"></a>Claude Code 三大工程化工具横评</h1><p>三者均为 Claude Code 生态的顶级增强工具，但<strong>核心定位、解决的问题、适用场景完全不同</strong>，并非同质化竞品，而是可互补协同的工程化套件。</p>]]>
    </summary>
    <title>Claude Code 三大工程化工具横评：Superpowers vs Compound Engineering vs Everything-Claude-Code</title>
    <updated>2026-05-04T12:47:16.055Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="工程实践" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E5%B7%A5%E7%A8%8B%E5%AE%9E%E8%B7%B5/"/>
    <category term="Claude Code" scheme="https://iyangjialin.github.io/tags/Claude-Code/"/>
    <category term="AI工程化" scheme="https://iyangjialin.github.io/tags/AI%E5%B7%A5%E7%A8%8B%E5%8C%96/"/>
    <category term="Compound Engineering" scheme="https://iyangjialin.github.io/tags/Compound-Engineering/"/>
    <category term="知识管理" scheme="https://iyangjialin.github.io/tags/%E7%9F%A5%E8%AF%86%E7%AE%A1%E7%90%86/"/>
    <content>
      <![CDATA[<h1 id="Compound-Engineering-插件全解析：AI-工程复利化实践指南"><a href="#Compound-Engineering-插件全解析：AI-工程复利化实践指南" class="headerlink" title="Compound Engineering 插件全解析：AI 工程复利化实践指南"></a>Compound Engineering 插件全解析：AI 工程复利化实践指南</h1><p>Compound Engineering 是 Claude Code 生态中<strong>唯一以「知识复利沉淀」为核心定位</strong>的 AI 软件工程体系。它通过 AI 技能（Skills）和智能体（Agents）实现”复合工程”理念——让每一次工程工作都能降低后续工作的难度，而非积累技术债务。</p><span id="more"></span><hr><h2 id="核心理念"><a href="#核心理念" class="headerlink" title="核心理念"></a>核心理念</h2><p>传统开发模式会随功能迭代积累复杂度和技术债务，而复合工程理念将 <strong>80% 的精力放在规划与评审、20% 放在执行</strong>，核心是通过”复利式”的工作闭环让每一次迭代都为后续工作提供价值：</p><blockquote><p><strong>复利式工作闭环</strong>：充分规划减少执行阶段的返工；严格评审不仅修复问题，还沉淀可复用的模式；知识固化让后续 AI 智能体无需重复踩坑。</p></blockquote><hr><h2 id="仓库结构"><a href="#仓库结构" class="headerlink" title="仓库结构"></a>仓库结构</h2><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br></pre></td><td class="code"><pre><span class="line">compound-engineering-plugin/</span><br><span class="line">├── .agents/                # 智能体相关配置</span><br><span class="line">├── plugins/                # 插件核心目录</span><br><span class="line">│   ├── coding-tutor/       # 编码辅导相关插件</span><br><span class="line">│   └── compound-engineering/ # 复合工程核心插件</span><br><span class="line">├── src/                    # 源代码目录</span><br><span class="line">│   ├── commands/           # 命令实现</span><br><span class="line">│   ├── converters/         # 格式转换工具</span><br><span class="line">│   ├── parsers/            # 解析器</span><br><span class="line">│   ├── release/            # 发布相关逻辑</span><br><span class="line">│   ├── targets/            # 目标适配</span><br><span class="line">│   ├── types/              # 类型定义</span><br><span class="line">│   └── utils/              # 通用工具函数</span><br><span class="line">├── tests/                  # 测试用例</span><br><span class="line">├── docs/                   # 文档（含产品脉搏报告）</span><br><span class="line">└── scripts/                # 脚本工具</span><br></pre></td></tr></table></figure><hr><h2 id="核心命令一览"><a href="#核心命令一览" class="headerlink" title="核心命令一览"></a>核心命令一览</h2><table><thead><tr><th>命令</th><th>用途</th></tr></thead><tbody><tr><td><code>/ce-strategy</code></td><td>生成&#x2F;维护 <code>STRATEGY.md</code>，定义产品核心目标、受众、指标</td></tr><tr><td><code>/ce-ideate</code></td><td>大方向构思：生成并评估创意，筛选最优方向</td></tr><tr><td><code>/ce-brainstorm</code></td><td>交互式问答梳理需求，生成适配的需求文档</td></tr><tr><td><code>/ce-plan</code></td><td>将需求转化为详细的实现计划</td></tr><tr><td><code>/ce-work</code></td><td>基于计划执行开发，含工作树和任务跟踪</td></tr><tr><td><code>/ce-debug</code></td><td>系统化复现问题、定位根因并实现修复</td></tr><tr><td><code>/ce-code-review</code></td><td>多智能体协同代码评审，降低合入风险</td></tr><tr><td><code>/ce-compound</code></td><td>沉淀学习成果，让后续工作更高效</td></tr><tr><td><code>/ce-product-pulse</code></td><td>生成产品脉搏报告，保存至 <code>docs/pulse-reports/</code></td></tr></tbody></table><hr><h2 id="典型工作流"><a href="#典型工作流" class="headerlink" title="典型工作流"></a>典型工作流</h2><h3 id="功能开发闭环"><a href="#功能开发闭环" class="headerlink" title="功能开发闭环"></a>功能开发闭环</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line">.ce-brainstorm <span class="string">&quot;优化后台任务重试机制的安全性&quot;</span>  <span class="comment"># 梳理需求</span></span><br><span class="line">.ce-plan docs/brainstorms/xxx-requirements.md  <span class="comment"># 制定实现计划</span></span><br><span class="line">.ce-work                                       <span class="comment"># 执行开发</span></span><br><span class="line">.ce-code-review                                <span class="comment"># 代码评审</span></span><br><span class="line">.ce-compound                                   <span class="comment"># 沉淀经验</span></span><br></pre></td></tr></table></figure><h3 id="问题排查闭环"><a href="#问题排查闭环" class="headerlink" title="问题排查闭环"></a>问题排查闭环</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br></pre></td><td class="code"><pre><span class="line">.ce-debug <span class="string">&quot;支付回调偶发创建重复发票&quot;</span>  <span class="comment"># 定位根因并修复</span></span><br><span class="line">.ce-code-review                     <span class="comment"># 评审修复代码</span></span><br><span class="line">.ce-compound                        <span class="comment"># 记录问题模式和解决方案</span></span><br></pre></td></tr></table></figure><hr><h2 id="安装与使用"><a href="#安装与使用" class="headerlink" title="安装与使用"></a>安装与使用</h2><h3 id="Claude-Code"><a href="#Claude-Code" class="headerlink" title="Claude Code"></a>Claude Code</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">/plugin marketplace add EveryInc/compound-engineering-plugin</span><br><span class="line">/plugin install compound-engineering</span><br></pre></td></tr></table></figure><h3 id="Cursor"><a href="#Cursor" class="headerlink" title="Cursor"></a>Cursor</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">/add-plugin compound-engineering  <span class="comment"># 或在插件市场搜索安装</span></span><br></pre></td></tr></table></figure><p>安装后执行 <code>.ce-setup</code> 完成环境检查、工具安装和项目配置初始化。</p><hr><h2 id="核心价值"><a href="#核心价值" class="headerlink" title="核心价值"></a>核心价值</h2><ol><li><strong>复利式迭代</strong>：每一次工作闭环（规划→执行→评审→沉淀）都会让下一次迭代更高效</li><li><strong>全流程覆盖</strong>：从战略规划、创意构思到开发、调试、评审、沉淀，覆盖工程全生命周期</li><li><strong>数据驱动</strong>：通过 <code>/ce-product-pulse</code> 生成的脉搏报告，让后续规划基于真实用户数据</li><li><strong>知识固化</strong>：沉淀的经验持续降低团队（及 AI 智能体）的认知成本</li></ol><blockquote><p>该仓库目前包含 <strong>37 个核心技能</strong>和 <strong>51 个智能体</strong>，是一套完整的 AI 辅助工程化解决方案。</p></blockquote><hr><h2 id="优势与短板深度解析"><a href="#优势与短板深度解析" class="headerlink" title="优势与短板深度解析"></a>优势与短板深度解析</h2><h3 id="核心优势"><a href="#核心优势" class="headerlink" title="核心优势"></a>核心优势</h3><h4 id="1-独有的知识复利体系"><a href="#1-独有的知识复利体系" class="headerlink" title="1. 独有的知识复利体系"></a>1. 独有的知识复利体系</h4><p>通过 <code>/compound</code>「复合沉淀」、<code>/learn</code>「主动学习」、<code>/recall</code>「精准召回」三大核心命令，构建了完整的知识闭环：</p><blockquote><ul><li>彻底解决 AI 编程的两大顽疾：<strong>会话重启就失忆</strong>、<strong>长会话上下文漂移</strong></li><li>真正实现「开发次数越多，AI 越懂你的项目，效率越高」的复利效应</li></ul></blockquote><h4 id="2-完整可追溯的工程闭环"><a href="#2-完整可追溯的工程闭环" class="headerlink" title="2. 完整可追溯的工程闭环"></a>2. 完整可追溯的工程闭环</h4><p>CE 在 Superpowers「规划-执行-审查」的闭环基础上，新增了核心的「沉淀复合」环节，形成了 PDCA 式的完整工程循环，从源头遏制技术债累积。</p><h4 id="3-团队技术资产的标准化沉淀"><a href="#3-团队技术资产的标准化沉淀" class="headerlink" title="3. 团队技术资产的标准化沉淀"></a>3. 团队技术资产的标准化沉淀</h4><p>将团队的编码规范、架构模式、业务最佳实践、安全红线、合规要求、踩坑避坑指南，全部沉淀为 AI 可自动遵循的规则。</p><h4 id="4-优秀的生态兼容性"><a href="#4-优秀的生态兼容性" class="headerlink" title="4. 优秀的生态兼容性"></a>4. 优秀的生态兼容性</h4><ul><li>原生深度适配 Claude Code</li><li>同时支持转换为 Cursor、GitHub Copilot、Gemini Code、Windsurf 等插件框架</li><li>可与 Superpowers、Everything-Claude-Code 无缝叠加使用</li></ul><h3 id="核心短板"><a href="#核心短板" class="headerlink" title="核心短板"></a>核心短板</h3><table><thead><tr><th>短板</th><th>说明</th></tr></thead><tbody><tr><td><strong>社区生态成熟度不足</strong></td><td>Stars 数量不足 Superpowers 的十分之一，配套资源稀少</td></tr><tr><td><strong>上手门槛偏高</strong></td><td>需要用户具备成熟的工程化思维，对新手不友好</td></tr><tr><td><strong>轻量化场景性价比低</strong></td><td>一次性小需求、快速原型开发场景，沉淀环节无收益</td></tr><tr><td><strong>效果依赖沉淀质量</strong></td><td>易出现「垃圾进垃圾出」，没有内置校验机制</td></tr><tr><td><strong>跨项目复用受限</strong></td><td>跨不同技术栈复用时易出现上下文污染</td></tr><tr><td><strong>强依赖大模型能力</strong></td><td>低配版本体验大打折扣，上下文窗口有限时效果差</td></tr></tbody></table><hr><h2 id="适配场景总结"><a href="#适配场景总结" class="headerlink" title="适配场景总结"></a>适配场景总结</h2><table><thead><tr><th>场景</th><th>适配度</th></tr></thead><tbody><tr><td>长期维护的中大型项目</td><td>⭐⭐⭐⭐⭐</td></tr><tr><td>有标准化需求的企业研发团队</td><td>⭐⭐⭐⭐⭐</td></tr><tr><td>需要严格管控技术债的合规性项目</td><td>⭐⭐⭐⭐</td></tr><tr><td>需要沉淀技术资产的稳定研发团队</td><td>⭐⭐⭐⭐</td></tr><tr><td>一次性小需求、快速原型开发</td><td>⭐</td></tr><tr><td>无工程化基础的新手用户</td><td>⭐</td></tr></tbody></table><hr><blockquote><p><strong>参考链接</strong>：<a href="https://every.to/guides/compound-engineering">Compound Engineering 官方指南</a></p></blockquote>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/04/compound-engineering-plugin/</id>
    <link href="https://iyangjialin.github.io/2026/05/04/compound-engineering-plugin/"/>
    <published>2026-05-04T13:00:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="Compound-Engineering-插件全解析：AI-工程复利化实践指南"><a href="#Compound-Engineering-插件全解析：AI-工程复利化实践指南" class="headerlink" title="Compound Engineering 插件全解析：AI 工程复利化实践指南"></a>Compound Engineering 插件全解析：AI 工程复利化实践指南</h1><p>Compound Engineering 是 Claude Code 生态中<strong>唯一以「知识复利沉淀」为核心定位</strong>的 AI 软件工程体系。它通过 AI 技能（Skills）和智能体（Agents）实现”复合工程”理念——让每一次工程工作都能降低后续工作的难度，而非积累技术债务。</p>]]>
    </summary>
    <title>Compound Engineering 插件全解析：AI 工程复利化实践指南</title>
    <updated>2026-05-04T12:41:34.774Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI洞察" scheme="https://iyangjialin.github.io/categories/AI%E6%B4%9E%E5%AF%9F/"/>
    <category term="深度访谈" scheme="https://iyangjialin.github.io/categories/AI%E6%B4%9E%E5%AF%9F/%E6%B7%B1%E5%BA%A6%E8%AE%BF%E8%B0%88/"/>
    <category term="Andrej Karpathy" scheme="https://iyangjialin.github.io/tags/Andrej-Karpathy/"/>
    <category term="Agentic Engineering" scheme="https://iyangjialin.github.io/tags/Agentic-Engineering/"/>
    <category term="Vibe Coding" scheme="https://iyangjialin.github.io/tags/Vibe-Coding/"/>
    <category term="Software 3.0" scheme="https://iyangjialin.github.io/tags/Software-3-0/"/>
    <category term="LLM" scheme="https://iyangjialin.github.io/tags/LLM/"/>
    <category term="AI工程" scheme="https://iyangjialin.github.io/tags/AI%E5%B7%A5%E7%A8%8B/"/>
    <category term="深度访谈" scheme="https://iyangjialin.github.io/tags/%E6%B7%B1%E5%BA%A6%E8%AE%BF%E8%B0%88/"/>
    <content>
      <![CDATA[<blockquote><p>视频来源：<a href="https://www.youtube.com/watch?v=96jN2OCOfLs">AI Ascent 2026 - Andrej Karpathy &amp; Stephanie Zhan</a><br>访谈时间：2026年<br>整理时间：2026-05-01</p></blockquote><!-- more --><hr><h2 id="访谈背景"><a href="#访谈背景" class="headerlink" title="访谈背景"></a>访谈背景</h2><table><thead><tr><th>人物</th><th>身份</th></tr></thead><tbody><tr><td><strong>Andrej Karpathy</strong></td><td>OpenAI联合创始人、特斯拉前AI负责人、Eureka Labs创始人</td></tr><tr><td><strong>Stephanie Zhan</strong></td><td>红杉资本合伙人</td></tr><tr><td><strong>对话场景</strong></td><td>AI Ascent 2026 峰会</td></tr></tbody></table><blockquote><p>Karpathy一年前提出的”vibe coding”概念，引发了行业对AI辅助编程的广泛讨论。一年后，他带来更深层的思考：<strong>agentic engineering</strong> 正在成为更严谨、更体系化的核心工程学科。</p></blockquote><hr><h2 id="一、软件开发范式的代际跃迁"><a href="#一、软件开发范式的代际跃迁" class="headerlink" title="一、软件开发范式的代际跃迁"></a>一、软件开发范式的代际跃迁</h2><p>Karpathy清晰阐释了软件范式的演进轨迹：</p><table><thead><tr><th>范式</th><th>核心特征</th><th>底层逻辑</th></tr></thead><tbody><tr><td><strong>Software 1.0</strong></td><td>人工硬编码规则</td><td>代码即逻辑，逻辑即规则</td></tr><tr><td><strong>Software 2.0</strong></td><td>基于数据训练的机器学习</td><td>代码即数据，数据即模型</td></tr><tr><td><strong>Software 3.0</strong></td><td>以LLM为底层计算平台</td><td>代码即提示，提示即程序</td></tr></tbody></table><blockquote><p><strong>Agents是Software 3.0的”安装程序”</strong> —— 它是将LLM的底层通用能力，落地到具体场景、实现端到端任务闭环的核心载体。</p></blockquote><hr><h2 id="二、从Vibe-Coding到Agentic-Engineering"><a href="#二、从Vibe-Coding到Agentic-Engineering" class="headerlink" title="二、从Vibe Coding到Agentic Engineering"></a>二、从Vibe Coding到Agentic Engineering</h2><h3 id="Vibe-Coding的局限"><a href="#Vibe-Coding的局限" class="headerlink" title="Vibe Coding的局限"></a>Vibe Coding的局限</h3><p>Vibe Coding（氛围编码）是基于LLM自然语言提示实现的<strong>直觉式、低门槛编码模式</strong>：</p><ul><li>✅ 大幅降低开发准入门槛</li><li>✅ 实现单环节编码效率跃升</li><li>❌ 随机性高，不可复用</li><li>❌ 不可控，无边界约束</li><li>❌ 难以完成复杂任务闭环</li></ul><h3 id="Agentic-Engineering的崛起"><a href="#Agentic-Engineering的崛起" class="headerlink" title="Agentic Engineering的崛起"></a>Agentic Engineering的崛起</h3><p>2026年，<strong>Agentic Engineering</strong> 在Vibe Coding基础上，成型为一套更严谨的工程学科：</p><blockquote><p>Agentic Engineering &#x3D; Vibe Coding的工业化、专业化升级</p></blockquote><table><thead><tr><th>维度</th><th>Vibe Coding</th><th>Agentic Engineering</th></tr></thead><tbody><tr><td><strong>粒度</strong></td><td>单次提示</td><td>可复用系统</td></tr><tr><td><strong>控制</strong></td><td>依赖直觉</td><td>可验证闭环</td></tr><tr><td><strong>边界</strong></td><td>模糊</td><td>刚性划定</td></tr><tr><td><strong>目标</strong></td><td>效率提升</td><td>任务全链路闭环</td></tr></tbody></table><hr><h2 id="三、LLM的本质：不是动物，而是”幽灵”"><a href="#三、LLM的本质：不是动物，而是”幽灵”" class="headerlink" title="三、LLM的本质：不是动物，而是”幽灵”"></a>三、LLM的本质：不是动物，而是”幽灵”</h2><p>Karpathy提出了极具标志性的判断：</p><blockquote><p><strong>我们不应将LLM视作拥有连续、稳定能力的动物，而应将其看作”锯齿状、统计性的、可被召唤的幽灵实体”。</strong></p></blockquote><h3 id="锯齿状技能（Jagged-Skills）"><a href="#锯齿状技能（Jagged-Skills）" class="headerlink" title="锯齿状技能（Jagged Skills）"></a>锯齿状技能（Jagged Skills）</h3><p>LLM的能力呈现<strong>极强的非连续性</strong>：</p><table><thead><tr><th>领域</th><th>LLM能力</th><th>人类能力</th></tr></thead><tbody><tr><td>复杂推理</td><td>⭐⭐⭐⭐⭐</td><td>⭐⭐⭐</td></tr><tr><td>代码生成</td><td>⭐⭐⭐⭐⭐</td><td>⭐⭐⭐</td></tr><tr><td>基础算术</td><td>⭐⭐</td><td>⭐⭐⭐⭐⭐</td></tr><tr><td>常识推理</td><td>⭐⭐</td><td>⭐⭐⭐⭐⭐</td></tr></tbody></table><h3 id="核心启示"><a href="#核心启示" class="headerlink" title="核心启示"></a>核心启示</h3><p>驾驭LLM不能依赖传统编程思维，而需要一套全新的：</p><ul><li><strong>审美判断力</strong> - 知道什么是对的、好的</li><li><strong>引导方法论</strong> - 如何让LLM发挥最大价值</li><li><strong>边界约束能力</strong> - 明确LLM能做什么、不能做什么</li></ul><hr><h2 id="四、可验证性：LLM落地的核心边界"><a href="#四、可验证性：LLM落地的核心边界" class="headerlink" title="四、可验证性：LLM落地的核心边界"></a>四、可验证性：LLM落地的核心边界</h2><p>Karpathy反复强调：</p><blockquote><p><strong>可验证性（Verifiability）是LLM与智能体落地的唯一核心边界。</strong></p></blockquote><h3 id="为什么可验证性如此重要？"><a href="#为什么可验证性如此重要？" class="headerlink" title="为什么可验证性如此重要？"></a>为什么可验证性如此重要？</h3><p>LLM只有在<strong>结果可被清晰验证</strong>的领域，才能最大化发挥价值、规避风险：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">可验证领域 → LLM价值最大化</span><br><span class="line">不可验证领域 → 能力不可控性急剧放大</span><br></pre></td></tr></table></figure><h3 id="核心设计准则"><a href="#核心设计准则" class="headerlink" title="核心设计准则"></a>核心设计准则</h3><p><strong>必须构建可验证的任务闭环</strong>：</p><ol><li>每个原子任务配套明确、可量化、可自动化校验的验收标准</li><li>执行完成后自动校验，不通过则触发智能体自主纠错</li><li>多次纠错失败直接抛出异常给人工处理</li></ol><hr><h2 id="五、核心金句"><a href="#五、核心金句" class="headerlink" title="五、核心金句"></a>五、核心金句</h2><blockquote><p><strong>你可以外包你的思考，但永远不能外包你的理解。</strong></p></blockquote><p>即便AI可以完成绝大多数执行、甚至推理思考环节，开发者与创始人必须守住对业务、系统、任务本质的底层理解——这是AI时代<strong>不可替代的核心壁垒</strong>。</p><hr><h2 id="六、行业趋势与开发者建议"><a href="#六、行业趋势与开发者建议" class="headerlink" title="六、行业趋势与开发者建议"></a>六、行业趋势与开发者建议</h2><h3 id="2026年行业共识"><a href="#2026年行业共识" class="headerlink" title="2026年行业共识"></a>2026年行业共识</h3><ol><li><strong>自然语言驱动的软件范式</strong>已成为行业必然方向</li><li><strong>“菜单式生成”（低代码&#x2F;可视化AI开发）与原生提示词工程的边界正在快速融合</strong></li><li>智能体将无处不在，开发者的学习路径必须彻底转型</li></ol><h3 id="给从业者的三条建议"><a href="#给从业者的三条建议" class="headerlink" title="给从业者的三条建议"></a>给从业者的三条建议</h3><table><thead><tr><th>建议</th><th>具体行动</th></tr></thead><tbody><tr><td><strong>拥抱不确定性</strong></td><td>从”我会什么”转向”我能驾驭什么”</td></tr><tr><td><strong>聚焦判断力</strong></td><td>把精力从执行转向决策、验证、边界约束</td></tr><tr><td><strong>建立闭环思维</strong></td><td>每个AI应用都要设计验证标准和纠错机制</td></tr></tbody></table><hr><h2 id="七、访谈时间轴"><a href="#七、访谈时间轴" class="headerlink" title="七、访谈时间轴"></a>七、访谈时间轴</h2><table><thead><tr><th>时间戳</th><th>主题</th></tr></thead><tbody><tr><td>00:00</td><td>Introduction</td></tr><tr><td>00:44</td><td>Feeling Behind as a Coder</td></tr><tr><td>02:28</td><td>Software 3.0 Explained</td></tr><tr><td>03:44</td><td>Agents as the Installer</td></tr><tr><td>04:49</td><td>Menu Gen vs Raw Prompts</td></tr><tr><td>07:37</td><td>What’s Obvious by 2026</td></tr><tr><td>09:41</td><td>Verifiability and Jagged Skills</td></tr><tr><td>13:39</td><td>Founder Advice and Automation</td></tr><tr><td>15:46</td><td>From Vibe Coding to Agent Engineering</td></tr><tr><td>25:17</td><td>Agents Everywhere and Learning</td></tr></tbody></table><hr><h2 id="相关资源"><a href="#相关资源" class="headerlink" title="相关资源"></a>相关资源</h2><ul><li><strong>视频</strong>：<a href="https://www.youtube.com/watch?v=96jN2OCOfLs">AI Ascent 2026 - YouTube</a></li></ul><hr><p><em>本文由 AI 辅助整理，核心内容来自 Andrej Karpathy 在 AI Ascent 2026 的公开演讲。</em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/01/karpathy-vibe-coding-to-agentic-engineering/</id>
    <link href="https://iyangjialin.github.io/2026/05/01/karpathy-vibe-coding-to-agentic-engineering/"/>
    <published>2026-05-01T14:04:00.000Z</published>
    <summary>OpenAI联合创始人Karpathy对话红杉资本，完整拆解从Vibe Coding到Agentic Engineering的范式升级，重新定义LLM时代开发者的生存逻辑。</summary>
    <title>Karpathy：从Vibe Coding到Agentic Engineering</title>
    <updated>2026-05-01T14:05:45.553Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI洞察" scheme="https://iyangjialin.github.io/categories/AI%E6%B4%9E%E5%AF%9F/"/>
    <category term="深度访谈" scheme="https://iyangjialin.github.io/categories/AI%E6%B4%9E%E5%AF%9F/%E6%B7%B1%E5%BA%A6%E8%AE%BF%E8%B0%88/"/>
    <category term="AI" scheme="https://iyangjialin.github.io/tags/AI/"/>
    <category term="大模型" scheme="https://iyangjialin.github.io/tags/%E5%A4%A7%E6%A8%A1%E5%9E%8B/"/>
    <category term="Agent时代" scheme="https://iyangjialin.github.io/tags/Agent%E6%97%B6%E4%BB%A3/"/>
    <category term="深度访谈" scheme="https://iyangjialin.github.io/tags/%E6%B7%B1%E5%BA%A6%E8%AE%BF%E8%B0%88/"/>
    <category term="罗福莉" scheme="https://iyangjialin.github.io/tags/%E7%BD%97%E7%A6%8F%E8%8E%89/"/>
    <category term="小米" scheme="https://iyangjialin.github.io/tags/%E5%B0%8F%E7%B1%B3/"/>
    <category term="MiMo" scheme="https://iyangjialin.github.io/tags/MiMo/"/>
    <category term="范式转移" scheme="https://iyangjialin.github.io/tags/%E8%8C%83%E5%BC%8F%E8%BD%AC%E7%A7%BB/"/>
    <content>
      <![CDATA[<blockquote><p>来源：<a href="https://mp.weixin.qq.com/s/zqnJuv5OVsNGEefM7RguqQ">张小珺访谈《独家对话罗福莉：AI范式已然巨变！》</a><br>视频：<a href="https://www.bilibili.com/video/BV1iVoVBgERD">https://www.bilibili.com/video/BV1iVoVBgERD</a><br>整理时间：2026-05-01</p></blockquote><!-- more --><hr><h2 id="访谈背景"><a href="#访谈背景" class="headerlink" title="访谈背景"></a>访谈背景</h2><ul><li><strong>访谈对象</strong>：罗福莉，小米大模型团队负责人，主导 MiMo-V2 系列模型研发，曾供职阿里达摩院、DeepSeek</li><li><strong>核心节点</strong>：2026 年大模型行业迎来范式巨变，从 <strong>Pre-train（预训练）主导的 Chat 时代</strong>，全面转向 <strong>Post-train（后训练）主导的 Agent 时代</strong></li><li><strong>触发变量</strong>：Claude Opus 4.6、OpenClaw 等技术突破引发全行业技术逻辑重构</li></ul><hr><h2 id="一、核心观点：范式已然巨变"><a href="#一、核心观点：范式已然巨变" class="headerlink" title="一、核心观点：范式已然巨变"></a>一、核心观点：范式已然巨变</h2><p>2026年大模型竞争已进入“第二幕”，发生了根本性的范式转移：</p><table><thead><tr><th>维度</th><th>Chat时代（2023-2025）</th><th>Agent时代（2026起）</th></tr></thead><tbody><tr><td><strong>竞争焦点</strong></td><td>预训练（Pre-train）主导</td><td>后训练（Post-train）主导</td></tr><tr><td><strong>入场券</strong></td><td>模型参数规模</td><td>1T参数的基座模型</td></tr><tr><td><strong>核心能力</strong></td><td>对话、文本生成</td><td>决策、工具调用、多步复杂任务</td></tr></tbody></table><hr><h2 id="二、技术判断与行业洞察"><a href="#二、技术判断与行业洞察" class="headerlink" title="二、技术判断与行业洞察"></a>二、技术判断与行业洞察</h2><h3 id="1-OpenClaw的”觉醒”时刻"><a href="#1-OpenClaw的”觉醒”时刻" class="headerlink" title="1. OpenClaw的”觉醒”时刻"></a>1. OpenClaw的”觉醒”时刻</h3><p>罗福莉将开源Agent框架 <strong>OpenClaw</strong> 视为”划时代的Agent框架”。她亲身体验后，认为其通过以下设计，能有效弥补模型的能力短板：</p><ul><li>精细的上下文编排</li><li>持久记忆机制</li><li>多模型调度能力</li></ul><p>这些设计 <strong>激发了中层模型的上限</strong>，让它们在许多场景下能达到接近顶尖模型的水平。</p><h3 id="2-Code的关键泛化力"><a href="#2-Code的关键泛化力" class="headerlink" title="2. Code的关键泛化力"></a>2. Code的关键泛化力</h3><p>编程（Code）被认为是具有<strong>极强泛化能力</strong>的场景。原因在于代码数据天然具备：</p><ul><li><strong>长上下文</strong> - 需要理解代码的前后依赖</li><li><strong>强关联</strong> - 函数调用、模块引用关系复杂</li></ul><p>在此基础上的训练，能让模型更好地处理Agent所需的长程、复杂任务。</p><h3 id="3-后训练成为赛点"><a href="#3-后训练成为赛点" class="headerlink" title="3. 后训练成为赛点"></a>3. 后训练成为赛点</h3><p>在新范式中，<strong>后训练（特别是强化学习RL的Scaling）变得与预训练同等甚至更加重要</strong>。</p><blockquote><p>竞争的关键在于：能否在多样的Agent框架中，让模型端到端地稳定完成高复杂度任务。</p></blockquote><h3 id="4-算力资源分配重构"><a href="#4-算力资源分配重构" class="headerlink" title="4. 算力资源分配重构"></a>4. 算力资源分配重构</h3><p>算力（卡）的调配比例发生巨变：</p><table><thead><tr><th>时代</th><th>研究</th><th>预训练</th><th>后训练</th></tr></thead><tbody><tr><td>Chat时代</td><td>3</td><td>5</td><td>1</td></tr><tr><td>Agent时代（合理）</td><td>3</td><td>1</td><td>1</td></tr><tr><td>顶尖团队</td><td>1</td><td>1</td><td>1</td></tr></tbody></table><blockquote><p><strong>后训练的算力权重迎来爆发式提升</strong>，从预训练的辅助环节，升级为决定产品竞争力的核心研发主线。</p></blockquote><h3 id="5-对多模态的再思考"><a href="#5-对多模态的再思考" class="headerlink" title="5. 对多模态的再思考"></a>5. 对多模态的再思考</h3><p>罗福莉表示，在Agent可以优雅编排多个专业模型的范式下，**”多模态是否促进智能”本身已不关键**。</p><p>当前更重要的是：模型能否在Agent框架内有效”行动”，而多模态理解是行动的必要条件之一。</p><hr><h2 id="三、组织与文化：创新如何诞生"><a href="#三、组织与文化：创新如何诞生" class="headerlink" title="三、组织与文化：创新如何诞生"></a>三、组织与文化：创新如何诞生</h2><h3 id="小米大模型团队的实践"><a href="#小米大模型团队的实践" class="headerlink" title="小米大模型团队的实践"></a>小米大模型团队的实践</h3><p>团队约100人，但<strong>没有严格的职级和固定小组划分</strong>。罗福莉认为任何层级和规范都是对创造力的约束，平权有利于所有人平等贡献智慧。</p><h4 id="核心管理理念"><a href="#核心管理理念" class="headerlink" title="核心管理理念"></a>核心管理理念</h4><ul><li><strong>热爱驱动</strong>：通过让成员深度体验新技术（如强制使用OpenClaw）来激发内在热情</li><li><strong>频繁碰撞</strong>：团队内沟通频繁、思想碰撞激烈</li><li><strong>招人标准</strong>：更看重<strong>好奇心、热爱和潜力</strong>，而非已有的大模型经验</li></ul><blockquote><p><strong>“环境比经验更重要”</strong> —— 良好的环境能让人快速习得所需技能。</p></blockquote><h4 id="对模糊性的容忍"><a href="#对模糊性的容忍" class="headerlink" title="对模糊性的容忍"></a>对模糊性的容忍</h4><p>Agent范式下的后训练和RL基础设施工作，需要比预训练时代<strong>更高的敏捷性和对模糊性的容忍度</strong>。团队必须具备快速开发、适配新系统的能力。</p><hr><h2 id="四、个人洞见与未来展望"><a href="#四、个人洞见与未来展望" class="headerlink" title="四、个人洞见与未来展望"></a>四、个人洞见与未来展望</h2><h3 id="AI训练AI即将到来"><a href="#AI训练AI即将到来" class="headerlink" title="AI训练AI即将到来"></a>AI训练AI即将到来</h3><p>罗福莉预见，AI将能先吸收人类智能，再通过自我迭代产生更强智能，实现”左脚踩右脚”式的提升。</p><blockquote><p>这可能在 <strong>一两年内</strong> 发生。</p></blockquote><h3 id="AGI路线图"><a href="#AGI路线图" class="headerlink" title="AGI路线图"></a>AGI路线图</h3><p>她预测，按照当前路径，<strong>AGI可能在两年内实现</strong>：</p><ol><li><strong>第一阶段</strong>：首先颠覆工作模式</li><li><strong>第二阶段</strong>：随着机器人等硬件进步，改变生活模式</li></ol><h3 id="开源的意义"><a href="#开源的意义" class="headerlink" title="开源的意义"></a>开源的意义</h3><p>她坚信 <strong>开源是加速AGI进程的关键</strong>，有利于促进Agent框架、芯片、能源等整个生态的繁荣。</p><h3 id="中美竞争态势"><a href="#中美竞争态势" class="headerlink" title="中美竞争态势"></a>中美竞争态势</h3><p>她判断，国内拥有1T基座模型的团队，与国外顶尖模型（如Claude Opus 4.6）的<strong>代差可能只有两三个月</strong>。</p><blockquote><p>接下来两三个月团队的应变和进化速度将至关重要。</p></blockquote><hr><h2 id="五、行业深度解读"><a href="#五、行业深度解读" class="headerlink" title="五、行业深度解读"></a>五、行业深度解读</h2><h3 id="1-范式转移的本质"><a href="#1-范式转移的本质" class="headerlink" title="1. 范式转移的本质"></a>1. 范式转移的本质</h3><table><thead><tr><th>维度</th><th>Chat时代</th><th>Agent时代</th></tr></thead><tbody><tr><td><strong>核心矛盾</strong></td><td>基础模型通用能力不足</td><td>如何把模型能力转化为Agent生产力</td></tr><tr><td><strong>资源倾斜</strong></td><td>所有资源向基座能力倾斜</td><td>释放模型能力、实现规模化落地</td></tr><tr><td><strong>技术重心</strong></td><td>预训练是绝对核心</td><td>后训练（强化学习）成为核心引擎</td></tr></tbody></table><h3 id="2-Anthropic路径成为共识"><a href="#2-Anthropic路径成为共识" class="headerlink" title="2. Anthropic路径成为共识"></a>2. Anthropic路径成为共识</h3><p>Anthropic的核心路径——通过RLHF&#x2F;RLAIF等强化学习技术实现模型能力提升——恰恰命中了Agent时代的核心需求：</p><ul><li>模型可控性</li><li>对齐性</li><li>复杂推理能力</li><li>工具调用能力</li></ul><h3 id="3-行业决胜窗口期"><a href="#3-行业决胜窗口期" class="headerlink" title="3. 行业决胜窗口期"></a>3. 行业决胜窗口期</h3><blockquote><p>大模型行业的迭代周期已从 **”年”压缩至”月”**。</p></blockquote><p>未来2-3个月，谁能最快落地新范式，谁就能在新赛道抢到先发优势。</p><h3 id="4-长期Scaling的核心焦虑"><a href="#4-长期Scaling的核心焦虑" class="headerlink" title="4. 长期Scaling的核心焦虑"></a>4. 长期Scaling的核心焦虑</h3><p>“不会在1T水平上走太久”的判断，本质是行业对Scaling Law的深度反思。</p><p>下一阶段的竞争，核心是找到Scaling的第二曲线：</p><ul><li>继续堆参数量？</li><li>Scaling数据质量？</li><li>强化学习迭代轮次？</li><li>多模态融合能力？</li><li>Agent闭环能力？</li></ul><hr><h2 id="访谈完整大纲"><a href="#访谈完整大纲" class="headerlink" title="访谈完整大纲"></a>访谈完整大纲</h2><table><thead><tr><th>时间戳</th><th>主题</th></tr></thead><tbody><tr><td>00:01:31</td><td>OpenClaw引发的行业巨变</td></tr><tr><td>00:23:32</td><td>群体智能对Agent框架的提升</td></tr><tr><td>00:40:46</td><td>2026作为生产力变革之年的核心逻辑</td></tr><tr><td>01:01:00</td><td>Agent的自进化与自迭代能力</td></tr><tr><td>01:18:54</td><td>MiMo-V2的技术布局：觉醒和伏击</td></tr><tr><td>01:44:39</td><td>1T模型仅为行业入场券的深层判断</td></tr><tr><td>01:51:48</td><td>大模型研发团队的组织平权</td></tr><tr><td>02:02:11</td><td>大模型训练的核心细节与成本拆解</td></tr><tr><td>02:08:18</td><td>大模型另类架构的探索与可能性</td></tr><tr><td>02:21:47</td><td>AI发展与人类生存危机的核心探讨</td></tr><tr><td>02:38:27</td><td>技术迭代下「每天否认昨天的自己」的研发常态</td></tr><tr><td>02:47:49</td><td>过去3年AI行业的完整进化史复盘</td></tr><tr><td>03:05:09</td><td>当下行业共识与头部竞争格局</td></tr><tr><td>03:19:00</td><td>技术成长中「环境比经验更重要」的核心观点</td></tr></tbody></table><hr><h2 id="相关资源"><a href="#相关资源" class="headerlink" title="相关资源"></a>相关资源</h2><ul><li><strong>公众号</strong>：<a href="https://mp.weixin.qq.com/s/zqnJuv5OVsNGEefM7RguqQ">语言即世界 language is world</a></li><li><strong>视频</strong>：<a href="https://www.bilibili.com/video/BV1iVoVBgERD">Bilibili 访谈视频</a></li><li><strong>联系方式</strong>：<a href="mailto:&#x78;&#105;&#x61;&#111;&#106;&#117;&#110;&#x7a;&#104;&#97;&#x6e;&#x67;&#x40;&#108;&#x69;&#115;&#x77;&#x2e;&#x61;&#105;">&#x78;&#105;&#x61;&#111;&#106;&#117;&#110;&#x7a;&#104;&#97;&#x6e;&#x67;&#x40;&#108;&#x69;&#115;&#x77;&#x2e;&#x61;&#105;</a></li></ul><blockquote><p>⚠️ 本内容不作为投资建议</p></blockquote><hr><p><em>本文由 AI 辅助整理，欢迎讨论交流。</em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/01/luo-fuli-ai-paradigm-shift/</id>
    <link href="https://iyangjialin.github.io/2026/05/01/luo-fuli-ai-paradigm-shift/"/>
    <published>2026-05-01T13:06:00.000Z</published>
    <summary>小米大模型团队负责人罗福莉首次公开长时间技术访谈，深入记录其对2026年AI范式巨变的系统性思考。</summary>
    <title>独家对话罗福莉：AI范式已然巨变</title>
    <updated>2026-05-01T13:07:40.143Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="使用指南" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97/"/>
    <category term="腾讯" scheme="https://iyangjialin.github.io/tags/%E8%85%BE%E8%AE%AF/"/>
    <category term="WorkBuddy" scheme="https://iyangjialin.github.io/tags/WorkBuddy/"/>
    <category term="AI智能体" scheme="https://iyangjialin.github.io/tags/AI%E6%99%BA%E8%83%BD%E4%BD%93/"/>
    <category term="桌面工作台" scheme="https://iyangjialin.github.io/tags/%E6%A1%8C%E9%9D%A2%E5%B7%A5%E4%BD%9C%E5%8F%B0/"/>
    <category term="实践案例" scheme="https://iyangjialin.github.io/tags/%E5%AE%9E%E8%B7%B5%E6%A1%88%E4%BE%8B/"/>
    <content>
      <![CDATA[<h1 id="实践案例大全"><a href="#实践案例大全" class="headerlink" title="实践案例大全"></a>实践案例大全</h1><blockquote><p>来源：<a href="https://www.codebuddy.cn/docs/workbuddy/Overview">WorkBuddy 官方文档</a><br>整理时间：2026-05-01</p></blockquote><!-- more --><hr><h2 id="目录"><a href="#目录" class="headerlink" title="目录"></a>目录</h2><ol><li><a href="#%E5%AE%9E%E8%B7%B5%E4%B8%80%E6%96%87%E4%BB%B6%E5%86%85%E5%AE%B9%E8%AF%86%E5%88%AB%E4%B8%8E%E5%A4%84%E7%90%86">实践一：文件内容识别与处理</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E4%BA%8C%E6%96%87%E6%A1%A3%E7%94%9F%E6%88%90%E4%B8%8E%E7%BC%96%E8%BE%91">实践二：文档生成与编辑</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E4%B8%89%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E5%B9%B6%E5%8F%AF%E8%A7%86%E5%8C%96">实践三：数据分析并可视化</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E5%9B%9B%E8%87%AA%E5%AA%92%E4%BD%93%E8%BF%90%E8%90%A5">实践四：自媒体运营</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E4%BA%94%E6%AF%8F%E6%97%A5%E8%87%AA%E5%8A%A8%E6%8E%A8%E9%80%81%E8%B5%84%E8%AE%AF%E7%AE%80%E6%8A%A5">实践五：每日自动推送资讯简报</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E5%85%AD%E8%BF%9C%E7%A8%8B%E9%81%A5%E6%8E%A7-workbuddy">实践六：远程遥控 WorkBuddy</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E4%B8%83%E9%9B%B6%E4%BB%A3%E7%A0%81%E5%88%B6%E4%BD%9C%E6%9C%AC%E5%9C%B0%E5%BA%94%E7%94%A8">实践七：零代码制作本地应用</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E5%85%AB%E8%87%AA%E6%88%91%E8%BF%9B%E5%8C%96%E5%88%9B%E5%BB%BA%E8%87%AA%E5%B7%B1%E7%9A%84-skills">实践八：自我进化——创建自己的 Skills</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E4%B9%9Dai-%E8%87%AA%E9%A9%B1%E5%8A%A8">实践九：AI 自驱动</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E5%8D%81%E4%B8%80%E5%8F%A5%E8%AF%9D%E7%AE%A1%E7%90%86%E4%BD%A0%E7%9A%84%E6%89%80%E6%9C%89%E4%BC%9A%E8%AE%AE">实践十：一句话管理你的所有会议</a></li><li><a href="#%E5%AE%9E%E8%B7%B5%E5%8D%81%E4%B8%80%E4%B8%80%E5%8F%A5%E8%AF%9D%E7%AE%A1%E7%90%86%E4%BD%A0%E7%9A%84%E8%85%BE%E8%AE%AF%E6%96%87%E6%A1%A3">实践十一：一句话管理你的腾讯文档</a></li></ol><hr><h2 id="实践一：文件内容识别与处理"><a href="#实践一：文件内容识别与处理" class="headerlink" title="实践一：文件内容识别与处理"></a>实践一：文件内容识别与处理</h2><h3 id="文档说明"><a href="#文档说明" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍如何使用 WorkBuddy 处理文档识别、会议纪要整理与外文视频翻译等任务，适用于需要快速提取内容、重组信息与生成结果文件的场景。</p><hr><h3 id="一句话批量命名文件"><a href="#一句话批量命名文件" class="headerlink" title="一句话批量命名文件"></a>一句话批量命名文件</h3><table><thead><tr><th align="center">项目</th><th align="left">内容</th></tr></thead><tbody><tr><td align="center"><strong>适用场景</strong></td><td align="left">目录中存在大量命名混乱的图片、合同、票据或资料文件。</td></tr><tr><td align="center"><strong>目标效果</strong></td><td align="left">根据文件内容或时间信息，自动生成统一、可检索的文件名。</td></tr></tbody></table><p><strong>示例指令</strong>：</p><blockquote><p>请读取这个文件夹中的文件内容或文件属性，按「日期 + 主题 + 类型」的规则批量重命名，并先展示重命名预览结果。</p></blockquote><hr><h3 id="整理会议纪要"><a href="#整理会议纪要" class="headerlink" title="整理会议纪要"></a>整理会议纪要</h3><table><thead><tr><th align="center">项目</th><th align="left">内容</th></tr></thead><tbody><tr><td align="center"><strong>适用场景</strong></td><td align="left">会议录音、聊天记录或零散笔记需要整理为正式纪要。</td></tr><tr><td align="center"><strong>目标效果</strong></td><td align="left">提炼议题、结论、待办事项与责任人。</td></tr></tbody></table><p><strong>示例指令</strong>：</p><blockquote><p>请根据我提供的会议记录，整理成一份正式会议纪要，包含会议主题、关键结论、行动项、负责人和截止时间。</p></blockquote><hr><h3 id="外文视频翻译"><a href="#外文视频翻译" class="headerlink" title="外文视频翻译"></a>外文视频翻译</h3><table><thead><tr><th align="center">项目</th><th align="left">内容</th></tr></thead><tbody><tr><td align="center"><strong>适用场景</strong></td><td align="left">课程视频、访谈内容、产品演示或培训视频需要翻译与摘要。</td></tr><tr><td align="center"><strong>目标效果</strong></td><td align="left">提取字幕内容，翻译为中文，并输出重点摘要。</td></tr></tbody></table><p><strong>示例指令</strong>：</p><blockquote><p>请帮我提取这个外文视频的字幕内容，翻译成中文，并整理成一份便于阅读的摘要文档，重点标出关键观点和专业术语。</p></blockquote><hr><h3 id="使用建议"><a href="#使用建议" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>明确输出格式</strong>：可提前说明需要 Markdown、Word、表格或纯文本。</li><li><strong>补充约束条件</strong>：例如命名规则、纪要结构、翻译风格与术语保留方式。</li><li><strong>优先处理小批量样本</strong>：先验证一次结果，再扩大到全量文件。</li></ul><hr><h2 id="实践二：文档生成与编辑"><a href="#实践二：文档生成与编辑" class="headerlink" title="实践二：文档生成与编辑"></a>实践二：文档生成与编辑</h2><h3 id="文档说明-1"><a href="#文档说明-1" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍如何通过 WorkBuddy 生成和修改 Word 文档与 PPT，适用于方案撰写、汇报材料制作、已有内容优化等场景。</p><hr><h3 id="一句话生成-Word-文档"><a href="#一句话生成-Word-文档" class="headerlink" title="一句话生成 Word 文档"></a>一句话生成 Word 文档</h3><h4 id="操作说明"><a href="#操作说明" class="headerlink" title="操作说明"></a>操作说明</h4><ul><li><strong>适用场景</strong>：快速生成通知、方案、申请、制度、汇报等正式文档。</li><li><strong>推荐做法</strong>：直接描述文档目标、对象、语气和结构要求。</li></ul><h4 id="示例指令"><a href="#示例指令" class="headerlink" title="示例指令"></a>示例指令</h4><blockquote><p>请帮我生成一份正式的项目立项申请，包含背景、目标、预算、实施计划和风险说明，整体语气正式，适合提交给管理层审批。</p></blockquote><h4 id="二次修改方式"><a href="#二次修改方式" class="headerlink" title="二次修改方式"></a>二次修改方式</h4><p>文档生成后，无需手动打开文件逐项修改，可直接继续对 WorkBuddy 说明调整意见，例如：</p><ul><li>预算清单需要更详细。</li><li>请为每个流程环节补充一条注意事项。</li><li>整体语气再正式一些，适合给老板审批。</li></ul><p>WorkBuddy 会在原有内容基础上继续修改，无需重新编写整段提示词。</p><hr><h3 id="根据素材和模板制作-PPT"><a href="#根据素材和模板制作-PPT" class="headerlink" title="根据素材和模板制作 PPT"></a>根据素材和模板制作 PPT</h3><h4 id="操作说明-1"><a href="#操作说明-1" class="headerlink" title="操作说明"></a>操作说明</h4><ul><li><strong>适用场景</strong>：已有文本素材、汇报大纲或参考模板，需要快速生成演示文稿。</li><li><strong>推荐做法</strong>：同时提供素材、页数要求、受众对象和风格偏好。</li></ul><h4 id="示例指令-1"><a href="#示例指令-1" class="headerlink" title="示例指令"></a>示例指令</h4><blockquote><p>请根据我提供的项目总结材料，制作一份 10 页以内的汇报 PPT，风格简洁专业，适合业务评审场景，并突出成果、数据和下一步计划。</p></blockquote><h4 id="辅助方式"><a href="#辅助方式" class="headerlink" title="辅助方式"></a>辅助方式</h4><p>还可以调用文档生成相关的 Skill，提升生成效率与版式质量。</p><hr><h3 id="使用建议-1"><a href="#使用建议-1" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>先说清目标读者</strong>：不同读者决定文档语气与内容深度。</li><li><strong>一次说明清楚结构</strong>：例如页数、章节、必须包含的模块。</li><li><strong>修改时直接说差异</strong>：与其重写，不如明确指出哪里需要补充、删减或调整风格。</li></ul><hr><h2 id="实践三：数据分析并可视化"><a href="#实践三：数据分析并可视化" class="headerlink" title="实践三：数据分析并可视化"></a>实践三：数据分析并可视化</h2><h3 id="文档说明-2"><a href="#文档说明-2" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍如何使用 WorkBuddy 完成表格可视化、数据搜集与报告生成，适用于经营分析、项目汇报、市场调研与业务复盘等场景。</p><hr><h3 id="将-Excel-表格转为可视化图表"><a href="#将-Excel-表格转为可视化图表" class="headerlink" title="将 Excel 表格转为可视化图表"></a>将 Excel 表格转为可视化图表</h3><h4 id="导入数据文件"><a href="#导入数据文件" class="headerlink" title="导入数据文件"></a>导入数据文件</h4><p>当你已经拥有 Excel、CSV 等数据文件时，可直接将文件拖入对话，或明确告诉 WorkBuddy 文件所在路径。</p><h4 id="描述分析需求"><a href="#描述分析需求" class="headerlink" title="描述分析需求"></a>描述分析需求</h4><p>建议一次说明以下信息：</p><ul><li>需要分析的指标</li><li>想看的图表类型</li><li>统计维度或时间范围</li><li>是否需要输出报告</li></ul><p><strong>示例指令</strong>：</p><blockquote><p>请读取这份销售数据，按月份统计各产品线的销售额和利润，分别生成柱状图与折线图，并补充一段结论说明。</p></blockquote><h4 id="预览结果"><a href="#预览结果" class="headerlink" title="预览结果"></a>预览结果</h4><p>WorkBuddy 会根据你的要求读取数据、完成统计并生成图表。</p><hr><h3 id="搜集数据并生成可视化报告"><a href="#搜集数据并生成可视化报告" class="headerlink" title="搜集数据并生成可视化报告"></a>搜集数据并生成可视化报告</h3><h4 id="描述数据需求"><a href="#描述数据需求" class="headerlink" title="描述数据需求"></a>描述数据需求</h4><p>当数据尚未整理成文件，或需要从网络、多个来源搜集信息时，可直接描述数据主题、范围和来源偏好。</p><p><strong>示例指令</strong>：</p><blockquote><p>请帮我搜集近 1 年国内 AI 办公工具相关的市场信息，重点关注用户规模、应用场景和代表产品，并整理成结构化数据。</p></blockquote><h4 id="描述报告要求"><a href="#描述报告要求" class="headerlink" title="描述报告要求"></a>描述报告要求</h4><p>建议同时说明报告格式、章节结构、图表偏好与汇报对象。</p><p><strong>示例指令</strong>：</p><blockquote><p>请基于搜集到的数据生成一份可视化分析报告，包含核心结论、关键数据图表、趋势判断和行动建议，适合管理层阅读。</p></blockquote><h4 id="输出结果"><a href="#输出结果" class="headerlink" title="输出结果"></a>输出结果</h4><p>WorkBuddy 会完成数据搜集、分析、绘图与报告排版，输出完整结果文件。</p><hr><h3 id="使用建议-2"><a href="#使用建议-2" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>先明确分析问题</strong>：先说清要回答什么业务问题，再决定图表形式。</li><li><strong>避免一次提过多要求</strong>：建议先产出基础版本，再逐轮补充图表与结论。</li><li><strong>说明数据可信度要求</strong>：如需公开来源、出处链接或时间范围，建议提前写明。</li></ul><hr><h2 id="实践四：自媒体运营"><a href="#实践四：自媒体运营" class="headerlink" title="实践四：自媒体运营"></a>实践四：自媒体运营</h2><h3 id="文档说明-3"><a href="#文档说明-3" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍如何借助 WorkBuddy 完成自媒体内容策划、文案撰写与视频素材整理，适用于小红书、短视频等内容生产场景。</p><hr><h3 id="小红书内容生成"><a href="#小红书内容生成" class="headerlink" title="小红书内容生成"></a>小红书内容生成</h3><ul><li><strong>适用场景</strong>：需要快速产出标题、正文、封面文案或选题方向。</li><li><strong>推荐做法</strong>：一次说明账号定位、受众人群、语气风格与内容目标。</li></ul><p><strong>示例指令</strong>：</p><blockquote><p>请根据我提供的产品卖点，帮我写 3 个适合小红书发布的选题，并为其中 1 个选题生成标题、正文、话题标签和封面文案，语气自然、真实、适合种草场景。</p></blockquote><hr><h3 id="视频内容生成"><a href="#视频内容生成" class="headerlink" title="视频内容生成"></a>视频内容生成</h3><ul><li><strong>适用场景</strong>：需要将脚本、口播文案、镜头分镜或视频说明快速整理出来。</li><li><strong>推荐做法</strong>：说明视频时长、平台类型、目标受众与输出形式。</li></ul><p><strong>示例指令</strong>：</p><blockquote><p>请帮我生成一份 60 秒短视频脚本，包含开头钩子、口播文案、镜头建议和结尾行动引导，整体节奏适合信息密度较高的内容账号。</p></blockquote><hr><h3 id="使用建议-3"><a href="#使用建议-3" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>先定平台，再写内容</strong>：不同平台的内容结构和节奏差异较大。</li><li><strong>明确人群与风格</strong>：能显著提升文案贴合度。</li><li><strong>先出初稿，再做微调</strong>：标题、封面、标签和正文建议分轮优化。</li></ul><hr><h2 id="实践五：每日自动推送资讯简报"><a href="#实践五：每日自动推送资讯简报" class="headerlink" title="实践五：每日自动推送资讯简报"></a>实践五：每日自动推送资讯简报</h2><h3 id="文档说明-4"><a href="#文档说明-4" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍如何使用 WorkBuddy 配置资讯简报的发送能力，并创建每日自动推送任务。适用于希望固定时间接收天气、新闻、行业动态与个人待办摘要的场景。</p><hr><h3 id="连接-QQ-邮箱"><a href="#连接-QQ-邮箱" class="headerlink" title="连接 QQ 邮箱"></a>连接 QQ 邮箱</h3><p>在发送邮件之前，需要先通过连接器将 QQ 邮箱与 WorkBuddy 对接。</p><blockquote><p>请参考 <a href="https://www.codebuddy.cn/docs/workbuddy/From-Beginner-to-Expert-Guide/Function-Description/Connector#%E4%B8%89%E3%80%81%E8%BF%9E%E6%8E%A5-qq-%E9%82%AE%E7%AE%B1">连接器指南 - 连接 QQ 邮箱</a> 完成配置。</p></blockquote><hr><h3 id="手动触发第一条简报"><a href="#手动触发第一条简报" class="headerlink" title="手动触发第一条简报"></a>手动触发第一条简报</h3><p>建议先手动执行一次，确认消息内容、发送流程与邮箱接收是否正常。</p><p><strong>示例指令</strong>：</p><blockquote><p>请生成今天的资讯简报，包含本地天气、AI 行业动态、重点新闻和我的任务摘要，并发送到我的 QQ 邮箱。</p></blockquote><p>执行过程中，WorkBuddy 通常会完成搜索、整理、生成和发送等步骤，整体耗时约 2 到 3 分钟。</p><hr><h3 id="设置每日定时发送"><a href="#设置每日定时发送" class="headerlink" title="设置每日定时发送"></a>设置每日定时发送</h3><p>手动跑通后，可继续创建自动化任务，让简报按固定时间自动发送。</p><p><strong>示例指令</strong>：</p><blockquote><p>请创建一个自动化任务，每天早上 8 点为我生成资讯简报并发送到 QQ 邮箱，内容包括天气、行业资讯和任务摘要。</p></blockquote><p>创建成功后，可在左侧边栏的自动化目录中统一管理所有定时任务。</p><hr><h3 id="个性化调整"><a href="#个性化调整" class="headerlink" title="个性化调整"></a>个性化调整</h3><p>简报内容可以通过自然语言持续调整，常见方向包括：</p><ul><li><strong>新增数据源</strong>：增加微博、知乎等平台的热榜内容。</li><li><strong>调整资讯范围</strong>：仅保留 A 股、财经或 AI 新闻。</li><li><strong>调整写作风格</strong>：改为更正式、轻松或摘要式的表达。</li><li><strong>限制发送日期</strong>：只在工作日执行，法定节假日不发送。</li></ul><p><strong>示例指令</strong>：</p><blockquote><p>请把简报改成只发送工作日版本，保留财经资讯和 AI 新闻，并将整体语气调整为简洁专业。</p></blockquote><hr><h3 id="使用建议-4"><a href="#使用建议-4" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>先验证发送链路</strong>：务必先手动发送成功，再开启自动化。</li><li><strong>控制内容长度</strong>：简报内容越聚焦，越适合长期阅读。</li><li><strong>逐步细化规则</strong>：建议先跑通基础版本，再补充节假日、频道来源等个性化要求。</li></ul><hr><h2 id="实践六：远程遥控-WorkBuddy"><a href="#实践六：远程遥控-WorkBuddy" class="headerlink" title="实践六：远程遥控 WorkBuddy"></a>实践六：远程遥控 WorkBuddy</h2><h3 id="文档说明-5"><a href="#文档说明-5" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍如何通过移动端与远程对话能力，让 WorkBuddy 在不坐在电脑前的情况下继续协助处理任务，适用于通勤、出差和跨设备办公场景。</p><hr><h3 id="手机远程完成电脑文件跨端传输"><a href="#手机远程完成电脑文件跨端传输" class="headerlink" title="手机远程完成电脑文件跨端传输"></a>手机远程完成电脑文件跨端传输</h3><ul><li><strong>适用场景</strong>：临时需要把电脑中的 PPT、文档或资料发送到手机或其他设备。</li><li><strong>推荐做法</strong>：在移动端明确说明文件名称、所在目录与目标动作。</li></ul><p><strong>示例指令</strong>：</p><blockquote><p>请帮我查找电脑里名为「项目汇报」的 PPT 文件，确认版本后整理到一个便于发送的目录，并告诉我下一步如何完成跨端传输。</p></blockquote><hr><h3 id="通勤时用手机继续远程对话编程"><a href="#通勤时用手机继续远程对话编程" class="headerlink" title="通勤时用手机继续远程对话编程"></a>通勤时用手机继续远程对话编程</h3><ul><li><strong>适用场景</strong>：不在工位时，希望继续推进调试、修复或文档整理任务。</li><li><strong>推荐做法</strong>：用自然语言描述当前问题、预期目标和可接受的处理范围。</li></ul><p><strong>示例指令</strong>：</p><blockquote><p>我现在不在电脑前，请继续排查这个项目的报错问题，优先查看最近一次运行日志，并先告诉我原因和处理建议，再决定是否修改代码。</p></blockquote><hr><h3 id="使用建议-5"><a href="#使用建议-5" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>先给清晰目标</strong>：远程场景下应避免模糊指令。</li><li><strong>减少高风险操作</strong>：涉及删除、覆盖、批量移动时，建议先要求预览。</li><li><strong>保留关键文件名</strong>：跨端操作时，明确文件名和目录能显著提升成功率。</li></ul><hr><h2 id="实践七：零代码制作本地应用"><a href="#实践七：零代码制作本地应用" class="headerlink" title="实践七：零代码制作本地应用"></a>实践七：零代码制作本地应用</h2><h3 id="文档说明-6"><a href="#文档说明-6" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍如何通过 WorkBuddy 以自然语言方式设计、生成、调试并持续升级本地应用，适用于无代码基础或希望快速验证想法的用户。</p><hr><h3 id="让-AI-帮你设计应用"><a href="#让-AI-帮你设计应用" class="headerlink" title="让 AI 帮你设计应用"></a>让 AI 帮你设计应用</h3><h4 id="操作说明-2"><a href="#操作说明-2" class="headerlink" title="操作说明"></a>操作说明</h4><p>为了让 AI 更好地完成应用开发工作，建议在代码开发模式中开启新的对话。</p><h4 id="示例指令-2"><a href="#示例指令-2" class="headerlink" title="示例指令"></a>示例指令</h4><blockquote><p>请帮我设计一个本地可运行的知识管理小工具，支持新增、搜索、编辑和分类，界面简洁，适合个人日常记录使用，并直接生成可运行的代码。</p></blockquote><h4 id="预期结果"><a href="#预期结果" class="headerlink" title="预期结果"></a>预期结果</h4><p>WorkBuddy 会理解需求，自动生成完整代码并尝试运行。</p><hr><h3 id="让-AI-帮你解决报错"><a href="#让-AI-帮你解决报错" class="headerlink" title="让 AI 帮你解决报错"></a>让 AI 帮你解决报错</h3><h4 id="操作说明-3"><a href="#操作说明-3" class="headerlink" title="操作说明"></a>操作说明</h4><p>项目运行过程中出现异常时，只需在对话中描述观察到的现象，WorkBuddy 会继续基于当前上下文进行排查。</p><h4 id="示例指令-3"><a href="#示例指令-3" class="headerlink" title="示例指令"></a>示例指令</h4><blockquote><p>点击保存按钮后页面白屏，控制台提示 TypeError，请帮我定位原因并修复。</p></blockquote><h4 id="提升修复效率的建议"><a href="#提升修复效率的建议" class="headerlink" title="提升修复效率的建议"></a>提升修复效率的建议</h4><ul><li><strong>描述具体现象</strong>：例如按钮名称、报错位置、触发步骤。</li><li><strong>支持多轮排查</strong>：首次修复未完全解决时，可继续补充最新现象。</li><li><strong>善用截图</strong>：报错界面、控制台信息和日志截图都能帮助定位问题。</li></ul><hr><h3 id="让-AI-帮你持续升级系统"><a href="#让-AI-帮你持续升级系统" class="headerlink" title="让 AI 帮你持续升级系统"></a>让 AI 帮你持续升级系统</h3><p>WorkBuddy 不仅可以生成初版应用，还可以在后续使用中持续扩展系统能力。</p><h4 id="常见升级场景"><a href="#常见升级场景" class="headerlink" title="常见升级场景"></a>常见升级场景</h4><table><thead><tr><th align="left">需求描述</th><th align="left">AI 可能执行的动作</th></tr></thead><tbody><tr><td align="left">希望支持模糊搜索，不依赖精确关键词</td><td align="left">接入本地向量或语义检索能力</td></tr><tr><td align="left">每天早上自动推送待处理任务</td><td align="left">配置自动化任务并汇总待办</td></tr><tr><td align="left">通过 QQ 或微信随时录入内容</td><td align="left">对接消息平台并增加移动端输入通道</td></tr><tr><td align="left">新增内容时自动关联已有记录</td><td align="left">增加关联分析与知识整理能力</td></tr></tbody></table><hr><h3 id="使用建议-6"><a href="#使用建议-6" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>先做最小可用版本</strong>：先完成核心功能，再逐步增加复杂能力。</li><li><strong>问题描述尽量具体</strong>：越具体，AI 越容易快速修复。</li><li><strong>把升级需求拆开提</strong>：一次只增加一类能力，更利于稳定迭代。</li></ul><hr><h2 id="实践八：自我进化——创建自己的-Skills"><a href="#实践八：自我进化——创建自己的-Skills" class="headerlink" title="实践八：自我进化——创建自己的 Skills"></a>实践八：自我进化——创建自己的 Skills</h2><h3 id="文档说明-7"><a href="#文档说明-7" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍如何借助 WorkBuddy 创建自定义 Skill，将重复出现的个人工作习惯、知识处理方式和任务逻辑沉淀为可复用能力。</p><hr><h3 id="适用场景"><a href="#适用场景" class="headerlink" title="适用场景"></a>适用场景</h3><ul><li>希望把固定流程沉淀为长期可复用的能力。</li><li>希望让 AI 在任意对话中自动识别某类意图并执行对应动作。</li><li>希望将个人笔记、灵感收集、知识整理流程产品化。</li></ul><hr><h3 id="案例说明"><a href="#案例说明" class="headerlink" title="案例说明"></a>案例说明</h3><p>基于前文提到的笔记应用场景，可以通过自定义 Skill 让系统自动识别用户的记录意图，并完成整理与保存，而不仅仅是普通的文本记录。</p><hr><h3 id="创建方式"><a href="#创建方式" class="headerlink" title="创建方式"></a>创建方式</h3><p>在对话框中直接说明你想要的能力、触发方式和输出结果。</p><p><strong>示例指令</strong>：</p><blockquote><p>请帮我创建一个用于记录灵感的自定义 Skill。当我输入灵感、想法或待验证创意时，自动识别内容类型，整理成结构化记录，并保存到指定目录。</p></blockquote><p>执行完成后，打开技能栏，在已安装目录下即可查看新创建的 Skill。</p><hr><h3 id="使用效果"><a href="#使用效果" class="headerlink" title="使用效果"></a>使用效果</h3><p>创建完成后，可在任意对话中直接使用自然语言触发该能力。</p><p><strong>示例指令</strong>：</p><blockquote><p>记一条灵感：做一个能自动整理会议纪要并同步到知识库的工具。</p></blockquote><p>WorkBuddy 一般会自动完成以下动作：</p><ol><li>识别这是一条灵感类内容。</li><li>将内容整理为结构化记录。</li><li>保存到指定位置，并反馈记录结果。</li></ol><hr><h3 id="使用建议-7"><a href="#使用建议-7" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>先定义单一能力</strong>：首个自定义 Skill 建议只解决一个明确问题。</li><li><strong>把触发条件说清楚</strong>：例如何时触发、写入哪里、输出什么结果。</li><li><strong>从高频动作开始</strong>：越高频的重复操作，越值得沉淀成 Skill。</li></ul><hr><h2 id="实践九：AI-自驱动"><a href="#实践九：AI-自驱动" class="headerlink" title="实践九：AI 自驱动"></a>实践九：AI 自驱动</h2><h3 id="文档说明-8"><a href="#文档说明-8" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍 WorkBuddy 的 AI 自驱动使用方式，即让系统在明确目标后自主拆解任务、执行步骤、检查结果并持续推进，适用于需要减少人工介入的复杂任务场景。</p><hr><h3 id="适用场景-1"><a href="#适用场景-1" class="headerlink" title="适用场景"></a>适用场景</h3><ul><li>需要从目标出发，自动拆分多个执行步骤。</li><li>需要连续完成搜索、整理、生成、校验等一整套流程。</li><li>需要在较少人工干预的情况下推进任务。</li></ul><hr><h3 id="推荐使用方式"><a href="#推荐使用方式" class="headerlink" title="推荐使用方式"></a>推荐使用方式</h3><h4 id="先说清任务目标"><a href="#先说清任务目标" class="headerlink" title="先说清任务目标"></a>先说清任务目标</h4><p>建议一次性说明目标结果、约束条件、输出格式和完成标准。</p><p><strong>示例指令</strong>：</p><blockquote><p>请自主完成这项任务：搜集近 1 周 AI 办公领域的重要动态，整理为一份简报，附上来源链接，并在输出前自行检查是否有重复信息。</p></blockquote><h4 id="允许其自行拆解步骤"><a href="#允许其自行拆解步骤" class="headerlink" title="允许其自行拆解步骤"></a>允许其自行拆解步骤</h4><p>WorkBuddy 会根据目标自动规划执行顺序，例如先搜集信息、再筛选重点、最后整理输出。</p><h4 id="要求其自检后再交付"><a href="#要求其自检后再交付" class="headerlink" title="要求其自检后再交付"></a>要求其自检后再交付</h4><p>如任务质量要求较高，建议明确提出复核要求。</p><p><strong>示例补充</strong>：</p><blockquote><p>输出前请自检一遍，确认结构完整、信息无重复、结论简洁明确。</p></blockquote><hr><h3 id="使用建议-8"><a href="#使用建议-8" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>目标越清楚，自驱效果越好</strong>：请尽量说明完成标准。</li><li><strong>复杂任务先给边界</strong>：例如时间范围、数据来源、文件格式。</li><li><strong>涉及高风险操作时先预览</strong>：删除、覆盖、迁移类动作建议先确认方案。</li></ul><hr><h2 id="实践十：一句话管理你的所有会议"><a href="#实践十：一句话管理你的所有会议" class="headerlink" title="实践十：一句话管理你的所有会议"></a>实践十：一句话管理你的所有会议</h2><h3 id="文档说明-9"><a href="#文档说明-9" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍如何在 WorkBuddy 中安装并使用腾讯会议 Skill，通过自然语言直接完成会议预约、修改、取消、查询，以及录制、转写和 AI 纪要整理等操作，适用于需要频繁开会、又不希望在多个应用之间来回切换的场景。</p><hr><h3 id="适用场景-2"><a href="#适用场景-2" class="headerlink" title="适用场景"></a>适用场景</h3><ul><li>正在编码、写文档或处理任务时，临时需要快速发起会议。</li><li>希望直接在 WorkBuddy 中完成会议的预约、修改与取消。</li><li>需要查看参会成员、会议录制、转写内容与智能纪要。</li><li>希望减少在编辑器、会议软件与笔记工具之间的反复切换。</li></ul><hr><h3 id="获取并安装腾讯会议-Skill"><a href="#获取并安装腾讯会议-Skill" class="headerlink" title="获取并安装腾讯会议 Skill"></a>获取并安装腾讯会议 Skill</h3><h4 id="获取个人-Token"><a href="#获取个人-Token" class="headerlink" title="获取个人 Token"></a>获取个人 Token</h4><p>首先打开腾讯会议 Skill 官方页面：<a href="https://meeting.tencent.com/ai-skill.html">快速跳转点我</a>，并使用腾讯会议账号完成登录。</p><p>在授权页面中，可直接获取并复制个人专属 Token。登录后，参考页面中的「WorkBuddy 原生接入流程」，按步骤完成授权与配置。</p><blockquote><p><strong>注意事项</strong>：Token 属于个人凭证，请妥善保管。<br><strong>补充说明</strong>：如 Token 失效，可重新访问授权页面获取新凭证。</p></blockquote><h4 id="在-WorkBuddy-中发起安装"><a href="#在-WorkBuddy-中发起安装" class="headerlink" title="在 WorkBuddy 中发起安装"></a>在 WorkBuddy 中发起安装</h4><p>完成上一步骤后，复制上图中第 1 步的命令，回到 WorkBuddy 对话窗口，直接粘贴安装指令，即可让 WorkBuddy 自动完成腾讯会议 Skill 的安装。</p><p>安装过程中，WorkBuddy 会自动创建任务，并完成下载、解析和配置等步骤。安装完成后，可在已安装技能列表中看到腾讯会议 Skill。</p><hr><h3 id="常见使用场景"><a href="#常见使用场景" class="headerlink" title="常见使用场景"></a>常见使用场景</h3><h4 id="会议管理"><a href="#会议管理" class="headerlink" title="会议管理"></a>会议管理</h4><p>可直接用自然语言完成预约、修改、取消和查询。</p><p><strong>示例指令</strong>：</p><blockquote><p>帮我创建一个腾讯会议，主题是技术方案讨论，今天下午 3 点到 4 点。</p></blockquote><blockquote><p>安排一个周期性会议，每周一上午 10 点，主题是团队周会。</p></blockquote><blockquote><p>把会议 450-743-140 的时间改到下午 4 点。</p></blockquote><blockquote><p>取消会议号 450-743-140 的会议。</p></blockquote><blockquote><p>查一下我今天有哪些会议。</p></blockquote><h4 id="成员管理"><a href="#成员管理" class="headerlink" title="成员管理"></a>成员管理</h4><p>当需要确认谁参加了会议、谁被邀请或谁正在等候室时，也可以直接在对话中查询。</p><p><strong>示例指令</strong>：</p><blockquote><p>会议 450-743-140 有哪些人参加了？</p></blockquote><blockquote><p>这个会议邀请了哪些人？</p></blockquote><blockquote><p>等候室里现在有谁？</p></blockquote><h4 id="录制、转写与智能纪要"><a href="#录制、转写与智能纪要" class="headerlink" title="录制、转写与智能纪要"></a>录制、转写与智能纪要</h4><p>会议结束后，可继续查询录制、查看转写，或直接获取 AI 生成的会议纪要。</p><p><strong>示例指令</strong>：</p><blockquote><p>帮我查一下最近的会议录制。</p></blockquote><blockquote><p>获取上次会议的录制下载链接。</p></blockquote><blockquote><p>帮我看看上次会议的转写内容。</p></blockquote><blockquote><p>在会议转写里搜索「技术方案」。</p></blockquote><blockquote><p>帮我获取这个会议的智能纪要。</p></blockquote><hr><h3 id="使用建议-9"><a href="#使用建议-9" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>注意 Token 时效</strong>：如安装或调用失败，可优先检查 Token 是否已过期。</li><li><strong>时间可直接自然表达</strong>：例如「今天下午 3 点到 4 点」「明早 9 点半」，通常无需手动换算格式。</li><li><strong>密码建议提前说明</strong>：若会议需要自定义密码，创建时可一并提出，常见密码规则为 4 到 6 位数字。</li><li><strong>会议号与周期规则要说清楚</strong>：查询、修改或取消时建议明确会议号；创建周期会议时建议说明是每天、工作日、每周、每两周还是每月。</li><li><strong>重要操作先核对信息</strong>：涉及修改与取消时，建议先查看当前会议信息再执行。</li></ul><hr><h2 id="实践十一：一句话管理你的腾讯文档"><a href="#实践十一：一句话管理你的腾讯文档" class="headerlink" title="实践十一：一句话管理你的腾讯文档"></a>实践十一：一句话管理你的腾讯文档</h2><h3 id="文档说明-10"><a href="#文档说明-10" class="headerlink" title="文档说明"></a>文档说明</h3><p>本文介绍如何在 WorkBuddy 中接入并使用腾讯文档相关能力，通过自然语言直接完成文档创建、内容整理、表格处理、多人协作汇总、权限查询与会议纪要沉淀等操作，适用于需要频繁处理在线文档、表格和收集表的办公场景。</p><hr><h3 id="适用场景-3"><a href="#适用场景-3" class="headerlink" title="适用场景"></a>适用场景</h3><ul><li>正在写方案、整理材料或推进项目时，需要快速创建腾讯文档。</li><li>希望直接在 WorkBuddy 中完成文档内容整理、改写、汇总与提炼。</li><li>需要处理腾讯文档中的表格数据、任务清单或收集表结果。</li><li>希望减少在编辑器、腾讯文档与聊天工具之间来回切换。</li></ul><hr><h3 id="获取并安装腾讯文档相关能力"><a href="#获取并安装腾讯文档相关能力" class="headerlink" title="获取并安装腾讯文档相关能力"></a>获取并安装腾讯文档相关能力</h3><h4 id="准备腾讯文档访问权限"><a href="#准备腾讯文档访问权限" class="headerlink" title="准备腾讯文档访问权限"></a>准备腾讯文档访问权限</h4><p>首先打开腾讯文档 Skill 官方页面：<a href="https://docs.qq.com/scenario/open-claw.html?nlc=1&needShowTips=1">快速跳转点我</a>，并使用腾讯文档账号完成登录。</p><p>在授权页面中，可直接获取并复制个人专属 Token。登录后，参考页面中的「接入流程」，按步骤完成授权与配置。</p><blockquote><p><strong>注意事项</strong>：Token 属于个人凭证，请妥善保管。<br><strong>补充说明</strong>：如 Token 失效，可重新访问授权页面获取新凭证。</p></blockquote><h4 id="在-WorkBuddy-中发起安装-1"><a href="#在-WorkBuddy-中发起安装-1" class="headerlink" title="在 WorkBuddy 中发起安装"></a>在 WorkBuddy 中发起安装</h4><p>完成上一步骤后，复制上图中第 1 步的命令，回到 WorkBuddy 对话窗口，直接粘贴安装指令，即可让 WorkBuddy 自动完成腾讯文档 Skill 的安装。</p><p>安装过程中，WorkBuddy 会自动创建任务，并完成下载、解析和配置等步骤。安装完成后，可在已安装技能列表中看到腾讯文档 Skill。</p><h4 id="安装完成后的效果"><a href="#安装完成后的效果" class="headerlink" title="安装完成后的效果"></a>安装完成后的效果</h4><p>安装成功后，即可在 WorkBuddy 中通过自然语言管理腾讯文档相关流程，无需手动切换多个页面或记忆复杂参数。</p><p>可支持的方向通常包括：</p><ul><li>创建腾讯文档、在线表格、收集表等内容载体。</li><li>修改文档标题、正文结构、表格字段与内容格式。</li><li>汇总多人评论、提炼重点结论与行动项。</li><li>查询文档权限、协作者信息和最近更新时间。</li><li>将会议纪要、项目进展、数据记录沉淀到腾讯文档中。</li></ul><hr><h3 id="常见使用场景-1"><a href="#常见使用场景-1" class="headerlink" title="常见使用场景"></a>常见使用场景</h3><h4 id="文档创建与整理"><a href="#文档创建与整理" class="headerlink" title="文档创建与整理"></a>文档创建与整理</h4><p>可直接用自然语言完成新建文档、补充内容、改写结构和整理格式。</p><p><strong>示例指令</strong>：</p><blockquote><p>帮我创建一份腾讯文档，标题是「项目复盘」，并先生成一个包含背景、问题、结论和行动项的结构。</p></blockquote><blockquote><p>帮我把这段内容整理成适合发给老板看的腾讯文档版本，语气简洁一些。</p></blockquote><blockquote><p>在腾讯文档里新建一份周报模板，包含本周进展、风险、下周计划三个部分。</p></blockquote><h4 id="表格与收集表管理"><a href="#表格与收集表管理" class="headerlink" title="表格与收集表管理"></a>表格与收集表管理</h4><p>当需要记录数据、统计反馈或收集信息时，也可以直接在对话中完成。</p><p><strong>示例指令</strong>：</p><blockquote><p>帮我新建一个腾讯文档在线表格，用来记录招聘进度，字段包含候选人、岗位、面试轮次、状态和备注。</p></blockquote><blockquote><p>帮我把这份表格按状态分类整理，并标出本周需要重点跟进的项目。</p></blockquote><blockquote><p>新建一个腾讯文档收集表，用来收集团队培训报名信息，包含姓名、部门、联系方式和参与场次。</p></blockquote><h4 id="协作内容汇总与纪要沉淀"><a href="#协作内容汇总与纪要沉淀" class="headerlink" title="协作内容汇总与纪要沉淀"></a>协作内容汇总与纪要沉淀</h4><p>多人协作后，可继续汇总评论、提取结论，或把会议内容沉淀为结构化文档。</p><p><strong>示例指令</strong>：</p><blockquote><p>帮我汇总这份腾讯文档里的评论，按「问题、建议、待确认事项」分类整理。</p></blockquote><blockquote><p>把刚才的会议内容整理成腾讯文档纪要，并补充行动项和负责人栏位。</p></blockquote><blockquote><p>帮我从这份项目文档中提炼出适合周会汇报的 5 条重点。</p></blockquote><h4 id="查询与权限协作"><a href="#查询与权限协作" class="headerlink" title="查询与权限协作"></a>查询与权限协作</h4><p>当需要确认文档归属、协作者范围或最近变更情况时，也可以直接让 WorkBuddy 帮忙查询。</p><p><strong>示例指令</strong>：</p><blockquote><p>帮我看一下这份腾讯文档最近是谁修改过。</p></blockquote><blockquote><p>这份文档目前有哪些协作者？谁有编辑权限？</p></blockquote><blockquote><p>帮我查一下「Q2 经营分析」这份腾讯文档是否已经共享给项目组。</p></blockquote><hr><h3 id="使用建议-10"><a href="#使用建议-10" class="headerlink" title="使用建议"></a>使用建议</h3><ul><li><strong>先确认文档权限</strong>：如读取失败、无法编辑或无法共享，可优先检查当前账号权限。</li><li><strong>复杂整理可先出提纲</strong>：对于长文档，建议先让 WorkBuddy 输出结构方案，再继续扩写或改写。</li><li><strong>表格处理先明确口径</strong>：涉及统计、筛选、分类时，建议说明字段含义与筛选规则。</li><li><strong>多人协作注意版本信息</strong>：如果文档频繁更新，建议先确认最近修改内容，再做汇总或重写。</li><li><strong>沉淀纪要时补充输出要求</strong>：例如是否需要待办、负责人、截止时间、风险项等字段。</li></ul><hr><h2 id="总结"><a href="#总结" class="headerlink" title="总结"></a>总结</h2><p>本文汇总了 WorkBuddy 的 11 个实战案例，涵盖：</p><table><thead><tr><th align="left">类别</th><th align="left">场景</th></tr></thead><tbody><tr><td align="left"><strong>内容处理</strong></td><td align="left">文件识别、会议纪要、视频翻译</td></tr><tr><td align="left"><strong>文档生成</strong></td><td align="left">Word 文档、PPT 制作</td></tr><tr><td align="left"><strong>数据分析</strong></td><td align="left">图表可视化、报告生成</td></tr><tr><td align="left"><strong>运营支持</strong></td><td align="left">小红书文案、短视频脚本</td></tr><tr><td align="left"><strong>自动化</strong></td><td align="left">每日简报、定时推送</td></tr><tr><td align="left"><strong>远程协作</strong></td><td align="left">跨设备操控、远程编程</td></tr><tr><td align="left"><strong>应用开发</strong></td><td align="left">零代码应用、报错修复</td></tr><tr><td align="left"><strong>技能定制</strong></td><td align="left">自定义 Skills</td></tr><tr><td align="left"><strong>AI 自驱动</strong></td><td align="left">自主拆解与执行</td></tr><tr><td align="left"><strong>办公集成</strong></td><td align="left">腾讯会议、腾讯文档</td></tr></tbody></table><p>更多内容请参考 <a href="https://www.codebuddy.cn/docs/workbuddy/Overview">WorkBuddy 官方文档</a>。</p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/01/workbuddy-practice-cases/</id>
    <link href="https://iyangjialin.github.io/2026/05/01/workbuddy-practice-cases/"/>
    <published>2026-05-01T05:30:00.000Z</published>
    <summary>本文汇总了 WorkBuddy 的 11 个实战案例，涵盖文件处理、文档生成、数据分析、自媒体运营、自动化简报、远程操控、本地应用开发、Skills 创建、AI 自驱动、腾讯会议管理和腾讯文档管理等场景。</summary>
    <title>实践案例大全</title>
    <updated>2026-05-01T05:45:04.864Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="AI工具" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/"/>
    <category term="使用指南" scheme="https://iyangjialin.github.io/categories/AI%E5%B7%A5%E5%85%B7/%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97/"/>
    <category term="腾讯" scheme="https://iyangjialin.github.io/tags/%E8%85%BE%E8%AE%AF/"/>
    <category term="WorkBuddy" scheme="https://iyangjialin.github.io/tags/WorkBuddy/"/>
    <category term="AI智能体" scheme="https://iyangjialin.github.io/tags/AI%E6%99%BA%E8%83%BD%E4%BD%93/"/>
    <category term="桌面工作台" scheme="https://iyangjialin.github.io/tags/%E6%A1%8C%E9%9D%A2%E5%B7%A5%E4%BD%9C%E5%8F%B0/"/>
    <category term="AI使用指南" scheme="https://iyangjialin.github.io/tags/AI%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97/"/>
    <content>
      <![CDATA[<h1 id="WorkBuddy-全指南"><a href="#WorkBuddy-全指南" class="headerlink" title="WorkBuddy 全指南"></a>WorkBuddy 全指南</h1><blockquote><p>本文档系统介绍 WorkBuddy 的核心概念、功能特性、工作流程和使用建议。</p></blockquote><span id="more"></span><hr><h2 id="目录"><a href="#目录" class="headerlink" title="目录"></a>目录</h2><ol><li><a href="#1-workbuddy-%E6%98%AF%E4%BB%80%E4%B9%88">WorkBuddy 是什么？</a></li><li><a href="#2-%E8%A7%A3%E5%86%B3%E4%BB%80%E4%B9%88%E9%97%AE%E9%A2%98">解决什么问题？</a></li><li><a href="#3-%E5%BF%AB%E9%80%9F%E4%B8%8A%E6%89%8B">快速上手</a></li><li><a href="#4-%E5%B7%A5%E4%BD%9C%E6%B5%81%E7%A8%8B">工作流程</a></li><li><a href="#5-%E7%9B%AE%E5%BD%95%E7%BB%93%E6%9E%84">目录结构</a></li><li><a href="#6-%E8%AE%B0%E5%BF%86%E7%B3%BB%E7%BB%9F">记忆系统</a></li><li><a href="#7-%E5%AE%89%E5%85%A8%E8%BE%B9%E7%95%8C">安全边界</a></li><li><a href="#8-%E5%AD%A6%E4%B9%A0%E8%B5%84%E6%96%99">学习资料</a></li></ol><hr><h2 id="1-WorkBuddy-是什么？"><a href="#1-WorkBuddy-是什么？" class="headerlink" title="1. WorkBuddy 是什么？"></a>1. WorkBuddy 是什么？</h2><p>WorkBuddy 是<strong>腾讯推出的全场景职场 AI 智能体桌面工作台</strong>，面向各类职能角色设计。它的定位是让 AI 真正成为可以干活的数字同事——用自然语言下达任务，WorkBuddy 会自主规划步骤、执行操作、交付结果。</p><h3 id="与传统-AI-的核心差异"><a href="#与传统-AI-的核心差异" class="headerlink" title="与传统 AI 的核心差异"></a>与传统 AI 的核心差异</h3><table><thead><tr><th align="center">对比维度</th><th align="center">传统 AI</th><th align="center">WorkBuddy</th></tr></thead><tbody><tr><td align="center">能力边界</td><td align="center">聊天、给建议</td><td align="center"><strong>实际执行任务</strong></td></tr><tr><td align="center">文件操作</td><td align="center">手动操作</td><td align="center"><strong>自动读写本地文件</strong></td></tr><tr><td align="center">任务复杂度</td><td align="center">单一步骤</td><td align="center"><strong>多步骤复杂任务</strong></td></tr><tr><td align="center">输出形式</td><td align="center">文字回复</td><td align="center"><strong>交付可验收的产物</strong></td></tr></tbody></table><blockquote><p>WorkBuddy 填补了”AI 建议”到”AI 执行”之间的鸿沟。</p></blockquote><hr><h2 id="2-解决什么问题？"><a href="#2-解决什么问题？" class="headerlink" title="2. 解决什么问题？"></a>2. 解决什么问题？</h2><p>WorkBuddy 核心解决的是<strong>从”AI 建议”到”AI 执行”的最后一公里</strong>：</p><table><thead><tr><th align="center">场景</th><th align="left">说明</th></tr></thead><tbody><tr><td align="center">📄 文档处理</td><td align="left">生成报告、邮件、周报、纪要，无需手动排版</td></tr><tr><td align="center">📊 数据分析</td><td align="left">上传数据文件，自动分析并可视化</td></tr><tr><td align="center">📊 PPT &#x2F; 报告生成</td><td align="left">从需求描述直接产出可演示的文档</td></tr><tr><td align="center">🔍 深度调研</td><td align="left">对复杂问题进行系统性研究，输出完整报告</td></tr><tr><td align="center">🗂️ 批量文件操作</td><td align="left">自动整理、重命名、格式转换</td></tr></tbody></table><p><strong>一句话：你能用电脑做的事，WorkBuddy 都能帮你做。</strong></p><hr><h2 id="3-快速上手"><a href="#3-快速上手" class="headerlink" title="3. 快速上手"></a>3. 快速上手</h2><h3 id="快速上手五步法"><a href="#快速上手五步法" class="headerlink" title="快速上手五步法"></a>快速上手五步法</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line">Step 1 → 打开 WorkBuddy，进入主界面</span><br><span class="line">Step 2 → 创建任务（输入任务描述，选择工作模式）</span><br><span class="line">Step 3 → 等待执行，查看右侧结果区的产物</span><br><span class="line">Step 4 → 在对话区追问或补充上下文</span><br><span class="line">Step 5 → 验收结果，下载或直接使用</span><br></pre></td></tr></table></figure><h3 id="三种工作模式"><a href="#三种工作模式" class="headerlink" title="三种工作模式"></a>三种工作模式</h3><table><thead><tr><th align="center">模式</th><th align="center">英文</th><th align="left">适用场景</th></tr></thead><tbody><tr><td align="center"><strong>执行模式</strong></td><td align="center">Craft</td><td align="left">明确知道要做什么，直接干活</td></tr><tr><td align="center"><strong>规划模式</strong></td><td align="center">Plan</td><td align="left">复杂任务，先设计路线图再行动</td></tr><tr><td align="center"><strong>对话模式</strong></td><td align="center">Ask</td><td align="left">纯问答，不修改任何文件</td></tr></tbody></table><h3 id="官方推荐的阅读顺序"><a href="#官方推荐的阅读顺序" class="headerlink" title="官方推荐的阅读顺序"></a>官方推荐的阅读顺序</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line">1. 快速开始 → 了解如何进入 WorkBuddy、发起第一个任务、界面基本结构</span><br><span class="line">2. 创建任务 → 了解如何选择工作模式、填写任务内容和补充上下文</span><br><span class="line">3. 任务管理 → 了解如何查看任务列表、按状态筛选、继续处理已有任务</span><br><span class="line">4. 任务对话 → 了解如何在对话区持续追问、上传文件、使用顶部操作</span><br><span class="line">5. 结果查看 → 了解如何在右侧结果区查看产物、全部文件、变更和预览</span><br></pre></td></tr></table></figure><hr><h2 id="4-工作流程"><a href="#4-工作流程" class="headerlink" title="4. 工作流程"></a>4. 工作流程</h2><h3 id="完整工作流程"><a href="#完整工作流程" class="headerlink" title="完整工作流程"></a>完整工作流程</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br></pre></td><td class="code"><pre><span class="line">用户下达任务</span><br><span class="line">    ↓</span><br><span class="line">WorkBuddy 分析任务意图与当前上下文</span><br><span class="line">    ↓</span><br><span class="line">选择工作模式</span><br><span class="line">    ├── Craft（执行模式）→ 直接执行，产出结果</span><br><span class="line">    ├── Plan（规划模式） → 设计方案，用户确认后再执行</span><br><span class="line">    └── Ask（对话模式） → 仅回答，不操作文件</span><br><span class="line">    ↓</span><br><span class="line">交付产物（文档 / 表格 / 代码 / 图表 / 视频等）</span><br><span class="line">    ↓</span><br><span class="line">用户验收，可追问或补充</span><br></pre></td></tr></table></figure><h3 id="Agent-Loop（执行循环）"><a href="#Agent-Loop（执行循环）" class="headerlink" title="Agent Loop（执行循环）"></a>Agent Loop（执行循环）</h3><p>WorkBuddy 在执行模式下的内部循环：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line">1. 分析上下文 — 理解用户意图和当前状态</span><br><span class="line">2. 思考 — 推理是否需要调整计划、推进阶段或采取行动</span><br><span class="line">3. 选择工具 — 根据计划选取下一个要执行的工具</span><br><span class="line">4. 执行操作 — 工具在沙盒环境中执行</span><br><span class="line">5. 接收观察 — 操作结果作为新观察附加到上下文中</span><br><span class="line">6. 迭代循环 — 重复以上步骤直至任务完成</span><br><span class="line">7. 呈现结果 — 通过消息和预览工具向用户交付结果</span><br></pre></td></tr></table></figure><hr><h2 id="5-目录结构"><a href="#5-目录结构" class="headerlink" title="5. 目录结构"></a>5. 目录结构</h2><p>WorkBuddy 在本地有两个层级的核心目录：</p><h3 id="用户级配置（-workbuddy-）"><a href="#用户级配置（-workbuddy-）" class="headerlink" title="用户级配置（~/.workbuddy/）"></a>用户级配置（<code>~/.workbuddy/</code>）</h3><p>全局生效，适用于所有项目。</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br></pre></td><td class="code"><pre><span class="line">~/.workbuddy/</span><br><span class="line">├── SOUL.md            # AI 的灵魂定义（行为准则、价值观）</span><br><span class="line">├── IDENTITY.md        # AI 的身份档案（名字、风格、emoji）</span><br><span class="line">├── USER.md            # 用户档案（用户信息、偏好）</span><br><span class="line">├── BOOTSTRAP.md       # 初始化脚本（首次运行时填充上述三个文件，完成后删除）</span><br><span class="line">├── skills/            # 用户级技能库（所有项目通用）</span><br><span class="line">├── mcp.json           # MCP 服务器配置</span><br><span class="line">└── workbuddy.db       # 自动化任务数据库（SQLite）</span><br></pre></td></tr></table></figure><h3 id="工作台区（每个项目独立）"><a href="#工作台区（每个项目独立）" class="headerlink" title="工作台区（每个项目独立）"></a>工作台区（每个项目独立）</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line">&#123;工作区&#125;/</span><br><span class="line">├── .workbuddy/</span><br><span class="line">│   ├── memory/</span><br><span class="line">│   │   ├── YYYY-MM-DD.md     # 每日日志（追加写入）</span><br><span class="line">│   │   └── MEMORY.md         # 长期记忆（持续更新）</span><br><span class="line">│   └── skills/              # 项目级技能库（仅本项目生效）</span><br><span class="line">└── [项目文件...]</span><br></pre></td></tr></table></figure><h3 id="记忆文件详解"><a href="#记忆文件详解" class="headerlink" title="记忆文件详解"></a>记忆文件详解</h3><table><thead><tr><th align="center">文件</th><th align="center">位置</th><th align="center">性质</th><th align="left">内容类型</th></tr></thead><tbody><tr><td align="center"><code>SOUL.md</code></td><td align="center">用户级</td><td align="center">持久化</td><td align="left">AI 行为准则、价值观、边界</td></tr><tr><td align="center"><code>IDENTITY.md</code></td><td align="center">用户级</td><td align="center">持久化</td><td align="left">AI 名字、风格、Emoji</td></tr><tr><td align="center"><code>USER.md</code></td><td align="center">用户级</td><td align="center">持久化</td><td align="left">用户背景、偏好、项目上下文</td></tr><tr><td align="center"><code>YYYY-MM-DD.md</code></td><td align="center">工作区级</td><td align="center">追加写入</td><td align="left">当天工作记录、决策、重要结果</td></tr><tr><td align="center"><code>MEMORY.md</code></td><td align="center">工作区级</td><td align="center">持续更新</td><td align="left">提炼后的长期知识、偏好、约定</td></tr></tbody></table><hr><h2 id="6-记忆系统"><a href="#6-记忆系统" class="headerlink" title="6. 记忆系统"></a>6. 记忆系统</h2><p>这是 WorkBuddy 最核心的设计之一——<strong>记忆外化为文件系统</strong>。</p><h3 id="三层记忆架构"><a href="#三层记忆架构" class="headerlink" title="三层记忆架构"></a>三层记忆架构</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br></pre></td><td class="code"><pre><span class="line">第1层 · 长期记忆 ──→ MEMORY.md       持久化，提炼精华，跨会话复用</span><br><span class="line">第2层 · 每日日志 ──→ YYYY-MM-DD.md   追加写入，30天后提炼进 MEMORY.md</span><br><span class="line">第3层 · 身份档案 ──→ SOUL/IDENTITY/USER.md  稳定不变，除非主动修改</span><br></pre></td></tr></table></figure><h3 id="记忆工作流"><a href="#记忆工作流" class="headerlink" title="记忆工作流"></a>记忆工作流</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br></pre></td><td class="code"><pre><span class="line">新会话开始</span><br><span class="line">    ↓ 读取 MEMORY.md + 今日/昨日日志</span><br><span class="line">恢复上下文</span><br><span class="line">    ↓</span><br><span class="line">执行任务</span><br><span class="line">    ↓ 完成实质性工作后立即写入</span><br><span class="line">写入今日日志（+ 必要时更新 MEMORY.md）</span><br><span class="line">    ↓</span><br><span class="line">会话结束</span><br></pre></td></tr></table></figure><h3 id="什么会被记忆？"><a href="#什么会被记忆？" class="headerlink" title="什么会被记忆？"></a>什么会被记忆？</h3><p><strong>会写入记忆的内容（有持久价值的）：</strong></p><ul><li>✅ 构建 &#x2F; 修改了某个应用或功能</li><li>✅ 修复了 Bug</li><li>✅ 选择了某个技术方案（框架、设计模式）</li><li>✅ 用户告知的项目约定或个人偏好</li><li>✅ 重要决策与背景</li></ul><p><strong>不会写入记忆的内容（临时性的）：</strong></p><ul><li>❌ 中间搜索结果</li><li>❌ 临时文件路径</li><li>❌ 工具调用错误</li><li>❌ 纯闲聊 &#x2F; 简单问答</li></ul><h3 id="记忆维护规则"><a href="#记忆维护规则" class="headerlink" title="记忆维护规则"></a>记忆维护规则</h3><ul><li><strong>每日文件超过 30 天</strong> → 提炼进 <code>MEMORY.md</code>，原文件删除</li><li><strong><code>MEMORY.md</code> 保持精炼</strong> → 遇到冲突时原地更新并注明日期</li><li><strong>手动可控</strong> → 可直接打开 <code>.workbuddy/memory/</code> 文件夹查看、编辑或删除 AI 的记忆</li></ul><hr><h2 id="7-安全边界"><a href="#7-安全边界" class="headerlink" title="7. 安全边界"></a>7. 安全边界</h2><h3 id="操作风险分级"><a href="#操作风险分级" class="headerlink" title="操作风险分级"></a>操作风险分级</h3><p>WorkBuddy 将文件操作按风险程度分为三个级别：</p><table><thead><tr><th align="center">级别</th><th align="center">区域</th><th align="left">操作限制</th></tr></thead><tbody><tr><td align="center">🔴 高风险</td><td align="center">Desktop、Downloads、Documents、Home</td><td align="left">扫描只读，操作需逐项确认</td></tr><tr><td align="center">🟡 中风险</td><td align="center">项目目录</td><td align="left">可执行，但批量操作有保护</td></tr><tr><td align="center">🟢 低风险</td><td align="center"><code>.workbuddy</code> 配置目录</td><td align="left">受保护，不受误删影响</td></tr></tbody></table><h3 id="安全操作规则"><a href="#安全操作规则" class="headerlink" title="安全操作规则"></a>安全操作规则</h3><table><thead><tr><th align="center">规则</th><th align="left">说明</th></tr></thead><tbody><tr><td align="center"><strong>强制警告</strong></td><td align="left">对个人目录的破坏性操作必须显示警告并要求确认</td></tr><tr><td align="center"><strong>逐项确认</strong></td><td align="left">删除 &#x2F; 重命名操作列出所有受影响文件路径</td></tr><tr><td align="center"><strong>先备份再操作</strong></td><td align="left">对个人目录的移动 &#x2F; 删除必须先创建备份</td></tr><tr><td align="center"><strong>使用回收站</strong></td><td align="left">优先使用系统回收站，而非直接删除</td></tr><tr><td align="center"><strong>小批量操作</strong></td><td align="left">每次最多 10 个文件，验证后再继续</td></tr><tr><td align="center"><strong>禁止危险路径</strong></td><td align="left"><code>C:\</code>、<code>/System</code>、<code>AppData</code>、<code>/Library</code> 等系统目录禁止递归删除</td></tr></tbody></table><h3 id="外部操作原则"><a href="#外部操作原则" class="headerlink" title="外部操作原则"></a>外部操作原则</h3><ul><li><strong>内部操作（读文件、整理、分析）</strong> → 大胆执行</li><li><strong>外部行动（发邮件、发消息、发社交媒体）</strong> → 先问再做，不确定时谨慎处理</li><li><strong>私密信息</strong> → 绝对保密，不对外泄露</li></ul><hr><h2 id="8-学习资料"><a href="#8-学习资料" class="headerlink" title="8. 学习资料"></a>8. 学习资料</h2><table><thead><tr><th align="center">资料</th><th align="left">地址</th></tr></thead><tbody><tr><td align="center">📖 官方文档首页</td><td align="left"><a href="https://www.codebuddy.cn/docs/workbuddy/Overview">https://www.codebuddy.cn/docs/workbuddy/Overview</a></td></tr><tr><td align="center">⚡ 快速开始</td><td align="left"><a href="https://www.codebuddy.cn/docs/workbuddy/QuickStart">https://www.codebuddy.cn/docs/workbuddy/QuickStart</a></td></tr><tr><td align="center">🛠️ 技能市场</td><td align="left">内置 100+ 领域专家，从左侧”专家”入口进入</td></tr><tr><td align="center">🔌 MCP 连接器</td><td align="left">支持腾讯文档、微云、腾讯会议、腾讯乐享、QQ邮箱、TAPD 等</td></tr><tr><td align="center">🤖 专家中心</td><td align="left">可与各领域专家对话，获取专业帮助</td></tr></tbody></table><h3 id="快速上手建议"><a href="#快速上手建议" class="headerlink" title="快速上手建议"></a>快速上手建议</h3><p>你现在处于<strong>初始化阶段</strong>——<code>BOOTSTRAP.md</code> 还存在，身份档案（IDENTITY &#x2F; USER）都是空的。建议按以下顺序上手：</p><ol><li><strong>走一遍初始化</strong> — 把 AI 的名字、风格、你的背景填进去，建立稳定的身份档案</li><li><strong>发一个实际任务</strong> — 感受三种工作模式（Craft &#x2F; Plan &#x2F; Ask）的差异</li><li><strong>观察记忆文件</strong> — 查看 <code>.workbuddy/memory/</code> 里写了什么，理解记忆是如何工作的</li></ol><hr><p><em>本文档由 WorkBuddy AI 整理，供用户参考。</em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/05/01/workbuddy-complete-guide/</id>
    <link href="https://iyangjialin.github.io/2026/05/01/workbuddy-complete-guide/"/>
    <published>2026-04-30T16:30:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="WorkBuddy-全指南"><a href="#WorkBuddy-全指南" class="headerlink" title="WorkBuddy 全指南"></a>WorkBuddy 全指南</h1><blockquote>
<p>本文档系统介绍 WorkBuddy 的核心概念、功能特性、工作流程和使用建议。</p>
</blockquote>]]>
    </summary>
    <title>WorkBuddy 全指南：腾讯全场景 AI 智能体工作台完全解析</title>
    <updated>2026-04-30T17:31:47.160Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="工具评测" scheme="https://iyangjialin.github.io/categories/%E5%B7%A5%E5%85%B7%E8%AF%84%E6%B5%8B/"/>
    <category term="开源" scheme="https://iyangjialin.github.io/tags/%E5%BC%80%E6%BA%90/"/>
    <category term="OpenClaw" scheme="https://iyangjialin.github.io/tags/OpenClaw/"/>
    <category term="AI Agent" scheme="https://iyangjialin.github.io/tags/AI-Agent/"/>
    <category term="Hermes" scheme="https://iyangjialin.github.io/tags/Hermes/"/>
    <category term="工具对比" scheme="https://iyangjialin.github.io/tags/%E5%B7%A5%E5%85%B7%E5%AF%B9%E6%AF%94/"/>
    <content>
      <![CDATA[<p>OpenClaw 与 Hermes Agent 是 2026 年开源 AI 智能体领域的两大标杆项目，均采用 MIT 开源协议，支持本地自托管、多模型接入、多消息通道适配与工具自动化能力。本报告从<strong>七大维度</strong>深度拆解对比，给出分场景选型建议。</p><span id="more"></span><hr><h2 id="一、核心定位"><a href="#一、核心定位" class="headerlink" title="一、核心定位"></a>一、核心定位</h2><h3 id="1-1-定位对比"><a href="#1-1-定位对比" class="headerlink" title="1.1 定位对比"></a>1.1 定位对比</h3><table><thead><tr><th>项目</th><th>核心定位</th><th>设计哲学</th><th>Slogan</th></tr></thead><tbody><tr><td><strong>OpenClaw</strong></td><td>完全运行在自有硬件上的开源个人 AI 助手，单用户、始终在线的自托管 AI 网关</td><td>本地优先、多通道统一、插件可扩展，做用户的「私有 AI 操作员」</td><td>Your own private AI operator, always on, always yours</td></tr><tr><td><strong>Hermes Agent</strong></td><td>Nous Research 打造的自进化 AI 智能体，具备闭环学习循环的模型无关代理运行时</td><td>从每一次交互中学习沉淀、自主优化，做用户的「持久化 AI 成长伙伴」</td><td>The agent that grows with you</td></tr></tbody></table><h3 id="1-2-设计理念核心差异"><a href="#1-2-设计理念核心差异" class="headerlink" title="1.2 设计理念核心差异"></a>1.2 设计理念核心差异</h3><ul><li><strong>能力锚点不同</strong>：OpenClaw 以「<strong>接入与控制</strong>」为核心；Hermes 以「<strong>学习与进化</strong>」为核心</li><li><strong>会话范式不同</strong>：OpenClaw 以通道为中心，会话独立隔离；Hermes 以用户为中心，跨会话共享记忆</li><li><strong>用户目标不同</strong>：OpenClaw 面向「随时可用」，主打 7×24 小时在线；Hermes 面向「长期搭档」，主打越用越懂你</li></ul><hr><h2 id="二、架构设计"><a href="#二、架构设计" class="headerlink" title="二、架构设计"></a>二、架构设计</h2><h3 id="2-1-OpenClaw：Hub-and-Spoke-中心辐射型"><a href="#2-1-OpenClaw：Hub-and-Spoke-中心辐射型" class="headerlink" title="2.1 OpenClaw：Hub-and-Spoke 中心辐射型"></a>2.1 OpenClaw：Hub-and-Spoke 中心辐射型</h3><p>OpenClaw 采用<strong>中心辐射型架构</strong>，核心是 <strong>Gateway 网关（WebSocket 控制平面）</strong>，所有消息、AI 调用、客户端连接、工具执行全量通过单一进程流转。</p><ul><li><strong>核心中枢层</strong>（<code>src/</code>）：网关、代理运行时、通道抽象、配置管理、会话生命周期、上下文引擎</li><li><strong>扩展插件层</strong>（<code>extensions/</code>）：100+ 独立插件，覆盖模型提供商、消息通道、工具能力</li><li><strong>终端适配层</strong>（<code>apps/</code>）：macOS &#x2F; iOS &#x2F; Android 原生客户端，与网关 WebSocket 配对</li><li><strong>能力封装层</strong>（<code>skills/</code>）：50+ 预制模块化技能，通过 ClawHub 分发</li></ul><blockquote><p>单进程 · 单配置 · 单 WebSocket 端点 · 默认绑定本地回环 · 数据默认本地留存</p></blockquote><h3 id="2-2-Hermes-Agent：分层解耦代理循环架构"><a href="#2-2-Hermes-Agent：分层解耦代理循环架构" class="headerlink" title="2.2 Hermes Agent：分层解耦代理循环架构"></a>2.2 Hermes Agent：分层解耦代理循环架构</h3><p>Hermes Agent 采用<strong>分层解耦架构</strong>，核心是 <code>AIAgent</code> 类的<strong>同步会话循环</strong>，CLI、网关、TUI、定时任务均为表现层，仅负责输入输出转发。</p><ul><li><strong>核心代理层</strong>（<code>agent/</code>）：提示词构建、上下文压缩、内存管理、智能模型路由、技能管理，30+ 模块</li><li><strong>工具执行层</strong>（<code>tools/</code>）：60+ 工具实现，支持 6 种执行后端（本地、Docker、SSH、Modal、Daytona、Singularity）</li><li><strong>接入表现层</strong>：CLI、TUI、网关、VS Code 扩展，所有入口复用同一核心代理逻辑</li><li><strong>记忆存储层</strong>：SQLite + FTS5 本地数据库，全会话全文检索、跨会话记忆召回</li><li><strong>网关适配层</strong>（<code>gateway/</code>）：15+ 消息平台适配器</li></ul><blockquote><p>核心逻辑强内聚 · 平台无关 · 自学习闭环原生实现 · 并行子代理调度</p></blockquote><h3 id="2-3-架构对比小结"><a href="#2-3-架构对比小结" class="headerlink" title="2.3 架构对比小结"></a>2.3 架构对比小结</h3><table><thead><tr><th>对比维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>核心中枢</td><td>Gateway 网关（流量控制中枢）</td><td>AIAgent 代理循环（逻辑决策中枢）</td></tr><tr><td>架构模式</td><td>中心辐射型，插件化松耦合</td><td>分层解耦型，核心逻辑强内聚</td></tr><tr><td>会话管理</td><td>通道级会话隔离，Docker 沙箱</td><td>用户级跨会话记忆，SQLite 全检索</td></tr><tr><td>能力扩展</td><td>插件接入网关</td><td>核心循环原生支持 + 工具扩展</td></tr><tr><td>数据流转</td><td>所有流量必经网关</td><td>表现层 → 核心循环 → 表现层</td></tr></tbody></table><hr><h2 id="三、能力矩阵"><a href="#三、能力矩阵" class="headerlink" title="三、能力矩阵"></a>三、能力矩阵</h2><blockquote><p><strong>本节是两者差异最密集的部分，拆分为多个子维度逐一对比。</strong></p></blockquote><h3 id="3-1-消息通道"><a href="#3-1-消息通道" class="headerlink" title="3.1 消息通道"></a>3.1 消息通道</h3><table><thead><tr><th>维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>支持数量</td><td>20+ 平台</td><td>15+ 平台</td></tr><tr><td>国内 IM</td><td>微信、企业微信、飞书、原生适配</td><td>v0.9.0 补齐上述支持</td></tr><tr><td>海外 IM</td><td>WhatsApp、Telegram、Discord、Slack、iMessage、Matrix</td><td>同左主流平台</td></tr><tr><td>IoT &#x2F; 办公</td><td>—</td><td>Home Assistant、邮件、钉钉</td></tr><tr><td>媒体附件</td><td>全通道适配</td><td>部分适配</td></tr><tr><td>群组路由</td><td>支持（群组路由、提及规则、回复线程）</td><td>基础支持</td></tr></tbody></table><p><strong>小结</strong>：OpenClaw 通道广度更优，国内 IM 适配成熟度高；Hermes 通道偏向场景化，与记忆能力结合更紧密。</p><h3 id="3-2-AI-模型支持"><a href="#3-2-AI-模型支持" class="headerlink" title="3.2 AI 模型支持"></a>3.2 AI 模型支持</h3><table><thead><tr><th>维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>模型提供商</td><td>30+（OpenAI、Anthropic、Google、Ollama 等）</td><td>OpenRouter（200+）、Anthropic、NVIDIA NIM、OpenAI 等 OpenAI 兼容端点</td></tr><tr><td>累计模型数</td><td>—</td><td>400+</td></tr><tr><td>高可用机制</td><td>故障转移系统，多提供商轮转兜底</td><td>智能强弱模型自动路由、降级链</td></tr><tr><td>并行处理</td><td>—</td><td>并行子代理，任务自动拆分委托</td></tr><tr><td>本地模型</td><td>Ollama 全面支持</td><td>支持本地模型接入</td></tr></tbody></table><p><strong>小结</strong>：OpenClaw 强调高可用（故障自动切换）；Hermes 强调精细化调度（按任务难度选择模型），使用成本更优。</p><h3 id="3-3-记忆与自学习"><a href="#3-3-记忆与自学习" class="headerlink" title="3.3 记忆与自学习"></a>3.3 记忆与自学习</h3><table><thead><tr><th>维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>记忆架构</td><td>插件化（LanceDB、Wiki），会话级上下文，无原生跨会话闭环</td><td>三层架构（短期 + 长期 + 技能），FTS5 全检索</td></tr><tr><td>跨会话记忆</td><td>❌ 需手动配置扩展</td><td>✅ 原生支持</td></tr><tr><td>自主学习</td><td>插件化，无原生进化能力</td><td>闭环学习循环，自主沉淀技能与记忆</td></tr><tr><td>技能生成</td><td>人工开发静态包</td><td>从交互中自动创建可复用技能</td></tr><tr><td>上下文压缩</td><td>会话级窗口控制</td><td>自动上下文压缩</td></tr></tbody></table><p><strong>小结</strong>：这是两者<strong>最核心的分水岭</strong>。OpenClaw 记忆是可选插件能力；Hermes 记忆与学习是原生核心能力，实现「越用越聪明」。</p><h3 id="3-4-工具与自动化"><a href="#3-4-工具与自动化" class="headerlink" title="3.4 工具与自动化"></a>3.4 工具与自动化</h3><table><thead><tr><th>维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>内置工具数</td><td>50+</td><td>60+</td></tr><tr><td>核心优势</td><td>CDP 浏览器自动化、Canvas 可视化工作区、端侧设备控制（相机、录屏、定位、通知）</td><td>沙箱代码执行、多环境远程操作、MCP 集成</td></tr><tr><td>执行后端</td><td>Docker 会话级沙箱</td><td>6 种（本地、Docker、SSH、Modal、Daytona、Singularity）</td></tr><tr><td>定时任务</td><td>Cron + Webhook</td><td>内置 Cron 调度器，自然语言定义定时任务</td></tr><tr><td>结果分发</td><td>—</td><td>跨平台自动分发</td></tr></tbody></table><h3 id="3-5-客户端与交互体验"><a href="#3-5-客户端与交互体验" class="headerlink" title="3.5 客户端与交互体验"></a>3.5 客户端与交互体验</h3><table><thead><tr><th>维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>客户端</td><td>CLI、Web UI、macOS &#x2F; iOS &#x2F; Android 原生客户端</td><td>CLI、Ink 终端 TUI、Web Dashboard、VS Code 扩展</td></tr><tr><td>移动端</td><td>✅ 原生支持，语音唤醒</td><td>❌ 无原生 App</td></tr><tr><td>语音能力</td><td>ElevenLabs + 系统 TTS，macOS&#x2F;iOS&#x2F;Android 全端覆盖</td><td>语音备忘录转录、Discord 语音接入，TTS 依赖模型提供商</td></tr><tr><td>技能系统</td><td>50+ 预制，ClawHub 分发，静态指令集</td><td>20+ 内置分类，代理自主创建可复用技能</td></tr><tr><td>多代理协同</td><td>会话间代理发现、消息互通</td><td>并行子代理，复杂任务自动拆分委托</td></tr></tbody></table><hr><h2 id="四、技术栈与开发生态"><a href="#四、技术栈与开发生态" class="headerlink" title="四、技术栈与开发生态"></a>四、技术栈与开发生态</h2><h3 id="4-1-技术栈对比"><a href="#4-1-技术栈对比" class="headerlink" title="4.1 技术栈对比"></a>4.1 技术栈对比</h3><table><thead><tr><th>技术维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>核心语言</td><td>TypeScript (ESM)</td><td>Python</td></tr><tr><td>最低运行环境</td><td>Node.js 22.16+（推荐 24+）</td><td>Python 3.11+</td></tr><tr><td>工程化</td><td>pnpm monorepo，tsdown 构建</td><td>模块化结构，pip 管理</td></tr><tr><td>测试</td><td>Vitest（单元 + 集成）</td><td>~3000 个测试用例，高覆盖</td></tr><tr><td>前端技术</td><td>Vite Web UI、Swift（macOS&#x2F;iOS）、Kotlin（Android）</td><td>Ink TUI、React Dashboard</td></tr><tr><td>容器化</td><td>Docker &#x2F; Docker Compose，会话级沙箱</td><td>Docker + 6 种远程执行后端</td></tr><tr><td>目标用户</td><td>全栈&#x2F;前端&#x2F;TypeScript 开发者</td><td>AI&#x2F;算法&#x2F;Python 开发者</td></tr></tbody></table><h3 id="4-2-生态对比"><a href="#4-2-生态对比" class="headerlink" title="4.2 生态对比"></a>4.2 生态对比</h3><table><thead><tr><th>生态维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>GitHub 星标</td><td>34.5 万+，27+ 活跃贡献者，月均 2-3 次迭代</td><td>3.5 万+（上线仅 2 个月），增速迅猛，Nous Research 背书</td></tr><tr><td>插件&#x2F;技能</td><td>ClawHub 3 万+ 技能插件，52000+ 工具</td><td>20+ 内置分类，MCP 工具集成，快速成长期</td></tr><tr><td>文档本地化</td><td>全中文，12 国语言，国内社区丰富</td><td>中文资源较少，v0.9.0 补齐国内平台适配</td></tr><tr><td>迁移工具</td><td>❌ 无</td><td>✅ <code>hermes claw migrate</code> 一键迁移 OpenClaw 配置与密钥</td></tr><tr><td>二次开发</td><td>TypeScript 插件 SDK 标准化，前端开发者友好</td><td>Python AI 工具链无缝集成，AI 研发门槛低</td></tr></tbody></table><hr><h2 id="五、部署与运维"><a href="#五、部署与运维" class="headerlink" title="五、部署与运维"></a>五、部署与运维</h2><table><thead><tr><th>运维维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>快速安装</td><td><code>npm</code> 全局一键，<code>openclaw onboard</code> 交互向导，5 分钟上线</td><td><code>curl</code> 一键脚本，<code>hermes setup</code> 向导</td></tr><tr><td>跨平台</td><td>原生 Windows &#x2F; macOS &#x2F; Linux</td><td>Linux &#x2F; macOS &#x2F; WSL2 &#x2F; Android Termux（Windows 需 WSL2）</td></tr><tr><td>常驻运行</td><td><code>--install-daemon</code> 一键注册系统服务（launchd &#x2F; systemd）</td><td>需手动配置 systemd &#x2F; launchd</td></tr><tr><td>运行管理</td><td>单进程 · 单配置 · 运维极简</td><td>单进程，配置与密钥分离，门槛低</td></tr><tr><td>版本更新</td><td>stable &#x2F; beta &#x2F; dev 三通道，<code>openclaw update</code></td><td><code>hermes update</code> 一键升级，偶有破坏性变更</td></tr><tr><td>自检工具</td><td><code>openclaw doctor</code> 安全配置审计</td><td><code>hermes doctor</code> 诊断权限与密钥风险</td></tr><tr><td>最低硬件</td><td>笔记本、家用服务器、低配 VPS</td><td>5 美元&#x2F;月 VPS，Android Termux</td></tr></tbody></table><hr><h2 id="六、安全与隐私"><a href="#六、安全与隐私" class="headerlink" title="六、安全与隐私"></a>六、安全与隐私</h2><table><thead><tr><th>安全维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>安全原则</td><td>本地优先，网关默认绑定本地回环，显式配置才对外开放</td><td>最小权限原则，高风险操作默认人工审批</td></tr><tr><td>输入防护</td><td>消息通道入站视为不可信，配对审批机制</td><td>会话隔离，自动内存刷新，未知消息默认拦截</td></tr><tr><td>隔离能力</td><td>Docker 沙箱，工具访问白名单，2026-04 重构审批系统</td><td>五层纵深防御（用户授权 → 命令审批 → 容器沙箱 → 权限隔离 → 超时拒绝）</td></tr><tr><td>隐私保护</td><td>全量数据在自有硬件，可完全离线运行，100% 可控</td><td>本地 SQLite，无云端强制依赖，可完全离线</td></tr><tr><td>安全审计</td><td>全链路审计，2026 年修复 SSRF、媒体上传高危漏洞</td><td>操作审计日志，高风险操作默认留痕</td></tr><tr><td>历史事件</td><td>2026-02 CVE-2026-25253 高危漏洞（13.5 万公网暴露），已完成安全加固</td><td>无大规模高危安全事件</td></tr></tbody></table><hr><h2 id="七、选型建议"><a href="#七、选型建议" class="headerlink" title="七、选型建议"></a>七、选型建议</h2><h3 id="7-1-选-OpenClaw"><a href="#7-1-选-OpenClaw" class="headerlink" title="7.1 选 OpenClaw"></a>7.1 选 OpenClaw</h3><table><thead><tr><th>场景</th><th>说明</th></tr></thead><tbody><tr><td>个人普通用户</td><td>需要 7×24 小时在线 AI 助手，跨微信&#x2F;Telegram&#x2F;WhatsApp 多 IM 统一使用</td></tr><tr><td>高隐私需求</td><td>所有数据全量在自有硬件，完全离线，无云端依赖</td></tr><tr><td>移动端深度集成</td><td>需要 macOS&#x2F;iOS 语音唤醒、Android 设备控制（SMS&#x2F;通知&#x2F;定位&#x2F;日历）</td></tr><tr><td>浏览器自动化</td><td>CDP 原生浏览器控制、网页操作、数据抓取</td></tr><tr><td>全栈&#x2F;前端开发者</td><td>熟悉 TypeScript，希望基于插件 SDK 快速二次开发</td></tr><tr><td>短期使用</td><td>使用周期 &lt; 3 个月，期望开箱即用、生态成熟</td></tr></tbody></table><h3 id="7-2-选-Hermes-Agent"><a href="#7-2-选-Hermes-Agent" class="headerlink" title="7.2 选 Hermes Agent"></a>7.2 选 Hermes Agent</h3><table><thead><tr><th>场景</th><th>说明</th></tr></thead><tbody><tr><td>长期 AI 伙伴</td><td>需要跨会话记忆，越用越懂你的偏好与工作流，长期 ROI 更高</td></tr><tr><td>开发者&#x2F;极客</td><td>复杂代码开发、远程运维、Docker&#x2F;SSH&#x2F;Modal 多环境支持</td></tr><tr><td>复杂任务处理</td><td>并行子代理调度、强弱模型智能路由，兼顾效率与成本</td></tr><tr><td>AI &#x2F; Python 开发者</td><td>自定义代理逻辑、记忆策略，与 LLM 研发工具链深度集成</td></tr><tr><td>跨平台自动化</td><td>定时日报生成、数据备份、系统巡检，多平台结果推送</td></tr><tr><td>长期使用</td><td>使用周期 &gt; 6 个月，能力随使用时长指数级增长</td></tr></tbody></table><hr><h2 id="八、总结"><a href="#八、总结" class="headerlink" title="八、总结"></a>八、总结</h2><h3 id="核心差异一览"><a href="#核心差异一览" class="headerlink" title="核心差异一览"></a>核心差异一览</h3><table><thead><tr><th>维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td>核心灵魂</td><td>「本地优先的统一 AI 网关」</td><td>「自进化的闭环学习代理」</td></tr><tr><td>核心关键词</td><td>接入、统一、可控</td><td>学习、记忆、进化</td></tr><tr><td>能力重心</td><td>多端接入、端侧融合、开箱即用</td><td>智能推理、自学习、复杂任务处理</td></tr><tr><td>技术栈</td><td>TypeScript &#x2F; Node.js，全栈生态</td><td>Python &#x2F; AI 研发工具链</td></tr><tr><td>记忆能力</td><td>插件化，可选能力</td><td>原生核心能力，三层架构</td></tr><tr><td>长期价值</td><td>随社区生态线性增长</td><td>随使用时长指数增长</td></tr></tbody></table><h3 id="未来趋势"><a href="#未来趋势" class="headerlink" title="未来趋势"></a>未来趋势</h3><ul><li><strong>OpenClaw</strong>：持续强化接入能力与安全合规，补齐自学习短板，巩固多通道网关市场地位</li><li><strong>Hermes Agent</strong>：优化自学习闭环与模型调度，补齐客户端与通道覆盖，成为个人长期 AI 伙伴标杆</li></ul><blockquote><p>两者代表两条不同路线，没有绝对优劣，只有场景适配。</p></blockquote><p><em>数据来源：项目官方文档、2026 年最新版本迭代日志、社区技术分析资料</em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/04/23/2026-04-23-openclaw-vs-hermes-agent-comparison/</id>
    <link href="https://iyangjialin.github.io/2026/04/23/2026-04-23-openclaw-vs-hermes-agent-comparison/"/>
    <published>2026-04-23T01:00:00.000Z</published>
    <summary>2026 年开源 AI 智能体领域两大标杆项目全面对比：核心定位、架构设计、能力矩阵、技术栈、部署运维、安全隐私七大维度深度拆解，含选型建议与未来趋势。</summary>
    <title>OpenClaw vs Hermes Agent 深度对比分析报告</title>
    <updated>2026-04-23T15:30:32.779Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="工具评测" scheme="https://iyangjialin.github.io/categories/%E5%B7%A5%E5%85%B7%E8%AF%84%E6%B5%8B/"/>
    <category term="OpenClaw" scheme="https://iyangjialin.github.io/tags/OpenClaw/"/>
    <category term="AI Agent" scheme="https://iyangjialin.github.io/tags/AI-Agent/"/>
    <category term="Hermes" scheme="https://iyangjialin.github.io/tags/Hermes/"/>
    <category term="工具对比" scheme="https://iyangjialin.github.io/tags/%E5%B7%A5%E5%85%B7%E5%AF%B9%E6%AF%94/"/>
    <content>
      <![CDATA[<p>上一篇从迁移视角对比了 Hermes 与 OpenClaw，本篇直接对照两个项目的官方文档，从<strong>学习能力、架构设计、功能矩阵</strong>三个维度做更底层的分析。</p><blockquote><p>数据来源：<a href="https://zread.ai/NousResearch/hermes-agent">zread.ai&#x2F;NousResearch&#x2F;hermes-agent</a> · <a href="https://zread.ai/openclaw/openclaw">zread.ai&#x2F;openclaw&#x2F;openclaw</a><br>更新时间：2026-04-22</p></blockquote><span id="more"></span><hr><h2 id="1-项目概览"><a href="#1-项目概览" class="headerlink" title="1. 项目概览"></a>1. 项目概览</h2><h3 id="Hermes-Agent"><a href="#Hermes-Agent" class="headerlink" title="Hermes Agent"></a>Hermes Agent</h3><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td><strong>项目</strong></td><td>NousResearch&#x2F;hermes-agent</td></tr><tr><td><strong>开发组织</strong></td><td>Nous Research</td></tr><tr><td><strong>编程语言</strong></td><td>Python 3.11+</td></tr><tr><td><strong>许可证</strong></td><td>MIT</td></tr><tr><td><strong>当前版本</strong></td><td>v0.10.0</td></tr><tr><td><strong>定位</strong></td><td><strong>自改进的 AI Agent 运行时</strong></td></tr><tr><td><strong>核心特性</strong></td><td>闭合学习循环 · 模型无关 · 多 Provider 路由</td></tr></tbody></table><blockquote><p>“Unlike conventional AI assistants that reset with every conversation, Hermes features a <strong>closed learning loop</strong> — it creates skills from experience, improves them during use, nudges itself to persist knowledge, searches its own past conversations, and builds a deepening model of your workflow over time.”</p></blockquote><h3 id="OpenClaw"><a href="#OpenClaw" class="headerlink" title="OpenClaw"></a>OpenClaw</h3><table><thead><tr><th>属性</th><th>值</th></tr></thead><tbody><tr><td><strong>项目</strong></td><td>openclaw&#x2F;openclaw</td></tr><tr><td><strong>开发组织</strong></td><td>OpenClaw Community</td></tr><tr><td><strong>编程语言</strong></td><td>TypeScript</td></tr><tr><td><strong>许可证</strong></td><td>MIT</td></tr><tr><td><strong>定位</strong></td><td><strong>本地优先的多渠道 AI 助手</strong></td></tr><tr><td><strong>核心特性</strong></td><td>本地运行 · 20+ 消息渠道 · 插件扩展</td></tr></tbody></table><blockquote><p>“OpenClaw is an open-source personal AI assistant that runs entirely on your own hardware. Think of it as your own private AI operator, always on, always yours.”</p></blockquote><h3 id="一句话总结"><a href="#一句话总结" class="headerlink" title="一句话总结"></a>一句话总结</h3><ul><li><strong>Hermes Agent</strong> &#x3D; 自改进的学习型 Agent</li><li><strong>OpenClaw</strong> &#x3D; 本地优先的多渠道助手</li></ul><hr><h2 id="2-核心技术对比"><a href="#2-核心技术对比" class="headerlink" title="2. 核心技术对比"></a>2. 核心技术对比</h2><table><thead><tr><th>维度</th><th>Hermes Agent</th><th>OpenClaw</th></tr></thead><tbody><tr><td><strong>语言</strong></td><td>Python 3.11+</td><td>TypeScript</td></tr><tr><td><strong>架构哲学</strong></td><td>模型无关运行时</td><td>本地优先控制平面</td></tr><tr><td><strong>学习能力</strong></td><td>✅ 闭合学习循环</td><td>❌ 无内置学习</td></tr><tr><td><strong>核心范式</strong></td><td>工具调用 + 记忆 + 压缩</td><td>消息网关 + 插件</td></tr><tr><td><strong>会话模型</strong></td><td>AIAgent 对话引擎</td><td>Pi Agent 会话模型</td></tr></tbody></table><h3 id="Hermes-的学习循环"><a href="#Hermes-的学习循环" class="headerlink" title="Hermes 的学习循环"></a>Hermes 的学习循环</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">用户交互 → 经验积累 → 技能自创建 → 使用中改进 → 知识持久化 → 下次会话 recall</span><br></pre></td></tr></table></figure><p>OpenClaw <strong>每次会话都是白板</strong>，没有内置学习机制。</p><hr><h2 id="3-架构设计对比"><a href="#3-架构设计对比" class="headerlink" title="3. 架构设计对比"></a>3. 架构设计对比</h2><h3 id="Hermes-Agent-架构"><a href="#Hermes-Agent-架构" class="headerlink" title="Hermes Agent 架构"></a>Hermes Agent 架构</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br></pre></td><td class="code"><pre><span class="line">┌─────────────────────────────────────────────────┐</span><br><span class="line">│              Hermes Agent Runtime                 │</span><br><span class="line">├─────────────────────────────────────────────────┤</span><br><span class="line">│  AIAgent Conversation Engine                     │</span><br><span class="line">│  ├── Tool Registry (50+ 内置工具)                │</span><br><span class="line">│  ├── Memory Manager (三层记忆)                   │</span><br><span class="line">│  ├── Context Compressor (自动压缩)               │</span><br><span class="line">│  ├── Skills System (SKILL.md 标准)               │</span><br><span class="line">│  └── Multi-Provider Router                       │</span><br><span class="line">├─────────────────────────────────────────────────┤</span><br><span class="line">│  Subagent Delegation (最多 3 并发子代理)          │</span><br><span class="line">│  MCP Integration                                 │</span><br><span class="line">│  Plugin Architecture                             │</span><br><span class="line">└─────────────────────────────────────────────────┘</span><br><span class="line">            ↓ 多平台交付</span><br><span class="line">    飞书 · 微信 · Telegram · Discord · ...</span><br></pre></td></tr></table></figure><h3 id="OpenClaw-架构（Hub-and-Spoke）"><a href="#OpenClaw-架构（Hub-and-Spoke）" class="headerlink" title="OpenClaw 架构（Hub-and-Spoke）"></a>OpenClaw 架构（Hub-and-Spoke）</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br></pre></td><td class="code"><pre><span class="line">              ┌─────────────────┐</span><br><span class="line">              │  Pi Agent Runtime│</span><br><span class="line">              └────────┬────────┘</span><br><span class="line">                       │</span><br><span class="line">        ┌──────────────┼──────────────┐</span><br><span class="line">        │              │              │</span><br><span class="line">┌───────▼───────┐      │    ┌─────────▼───────┐</span><br><span class="line">│ Model Providers│      │    │  Clients         │</span><br><span class="line">│ OpenAI        │      │    │  CLI             │</span><br><span class="line">│ Anthropic     │      │    │  Web Chat        │</span><br><span class="line">│ Google        │      │    │  macOS/iOS/Android│</span><br><span class="line">│ Ollama/Local  │      │    └──────────────────┘</span><br><span class="line">│ 30+ more      │      │</span><br><span class="line">└───────────────┘      │</span><br><span class="line">              ┌────────┴────────────────────┐</span><br><span class="line">              │                             │</span><br><span class="line">  ┌───────────▼──────┐         ┌────────────▼──────┐</span><br><span class="line">  │ Messaging Channels│         │ Gateway (WS)      │</span><br><span class="line">  │ WhatsApp          │         │ ws://127.0.0.1    │</span><br><span class="line">  │ Telegram          │         │    :18789         │</span><br><span class="line">  │ Slack / Discord   │         └───────────────────┘</span><br><span class="line">  │ Signal / 20+ more │</span><br><span class="line">  └───────────────────┘</span><br></pre></td></tr></table></figure><h3 id="核心架构差异"><a href="#核心架构差异" class="headerlink" title="核心架构差异"></a>核心架构差异</h3><table><thead><tr><th>差异点</th><th>Hermes Agent</th><th>OpenClaw</th></tr></thead><tbody><tr><td><strong>中心组件</strong></td><td>AIAgent 引擎</td><td>Gateway WebSocket</td></tr><tr><td><strong>绑定方式</strong></td><td>工具 + 记忆</td><td>消息通道</td></tr><tr><td><strong>数据流向</strong></td><td>用户 → Agent → 工具</td><td>用户 → Gateway → Agent → Provider</td></tr><tr><td><strong>本地化</strong></td><td>可选</td><td><strong>核心设计原则</strong></td></tr><tr><td><strong>端口</strong></td><td>无固定端口</td><td><code>ws://127.0.0.1:18789</code></td></tr></tbody></table><hr><h2 id="4-功能特性逐项对比"><a href="#4-功能特性逐项对比" class="headerlink" title="4. 功能特性逐项对比"></a>4. 功能特性逐项对比</h2><h3 id="4-1-学习与记忆"><a href="#4-1-学习与记忆" class="headerlink" title="4.1 学习与记忆"></a>4.1 学习与记忆</h3><table><thead><tr><th>特性</th><th>Hermes Agent</th><th>OpenClaw</th></tr></thead><tbody><tr><td><strong>学习循环</strong></td><td>✅ 闭合学习 · 自创技能 · 使用中改进</td><td>❌ 无</td></tr><tr><td><strong>长期记忆</strong></td><td>✅ MEMORY.md + USER.md + FTS5</td><td>❌ 简单文件存储</td></tr><tr><td><strong>会话搜索</strong></td><td>✅ FTS5 全文 + LLM 摘要</td><td>❌ 基础历史</td></tr><tr><td><strong>跨会话 recall</strong></td><td>✅</td><td>❌</td></tr><tr><td><strong>记忆容量管理</strong></td><td>✅ 严格限制 + 自动整合</td><td>❌ 无</td></tr><tr><td><strong>记忆安全扫描</strong></td><td>✅ Injection 扫描</td><td>❌ 无</td></tr><tr><td><strong>外部记忆 Provider</strong></td><td>✅ 8 种（Honcho &#x2F; Mem0 &#x2F; Holographic…）</td><td>❌ 无</td></tr></tbody></table><p><strong>结论</strong>：Hermes 记忆系统远超 OpenClaw。</p><h3 id="4-2-Agent-能力"><a href="#4-2-Agent-能力" class="headerlink" title="4.2 Agent 能力"></a>4.2 Agent 能力</h3><table><thead><tr><th>特性</th><th>Hermes Agent</th><th>OpenClaw</th></tr></thead><tbody><tr><td><strong>核心引擎</strong></td><td>AIAgent Conversation Engine</td><td>Pi Agent</td></tr><tr><td><strong>多 Agent 路由</strong></td><td>✅ 子代理委托系统</td><td>✅ Multi-Agent Routing</td></tr><tr><td><strong>并行工具执行</strong></td><td>✅</td><td>❌ 顺序执行</td></tr><tr><td><strong>上下文压缩</strong></td><td>✅ 自动 Context Compression Engine</td><td>✅ Context Engine</td></tr><tr><td><strong>会话检查点</strong></td><td>✅ 自动快照 + <code>/rollback</code></td><td>❌ 无</td></tr><tr><td><strong>对话历史</strong></td><td>SQLite FTS5</td><td>基础支持</td></tr></tbody></table><h3 id="4-3-消息平台"><a href="#4-3-消息平台" class="headerlink" title="4.3 消息平台"></a>4.3 消息平台</h3><table><thead><tr><th>平台</th><th>Hermes Agent</th><th>OpenClaw</th></tr></thead><tbody><tr><td><strong>飞书</strong></td><td>✅ 原生集成</td><td>❌ 无</td></tr><tr><td><strong>微信</strong></td><td>✅ 原生集成</td><td>❌ 无</td></tr><tr><td>Telegram</td><td>✅</td><td>✅</td></tr><tr><td>Discord</td><td>✅</td><td>✅</td></tr><tr><td>Slack</td><td>✅</td><td>✅</td></tr><tr><td>WhatsApp</td><td>✅</td><td>✅</td></tr><tr><td>Signal</td><td>✅</td><td>✅</td></tr><tr><td>Matrix</td><td>✅</td><td>❌</td></tr><tr><td>Mattermost</td><td>✅</td><td>❌</td></tr><tr><td>Home Assistant</td><td>✅</td><td>❌</td></tr><tr><td><strong>平台总数</strong></td><td>10+</td><td>20+</td></tr></tbody></table><p><strong>结论</strong>：OpenClaw 支持更多小众平台，但 Hermes 覆盖了飞书&#x2F;微信这个关键差异。</p><h3 id="4-4-开发工具"><a href="#4-4-开发工具" class="headerlink" title="4.4 开发工具"></a>4.4 开发工具</h3><table><thead><tr><th>特性</th><th>Hermes Agent</th><th>OpenClaw</th></tr></thead><tbody><tr><td><strong>TDD 支持</strong></td><td>✅ RED-GREEN-REFACTOR</td><td>❌ 无</td></tr><tr><td><strong>系统调试</strong></td><td>✅ 4 阶段根因调查</td><td>❌ 基础</td></tr><tr><td><strong>代码审查</strong></td><td>✅ 独立审查子代理</td><td>❌ 基础</td></tr><tr><td><strong>计划模式</strong></td><td>✅ plan + writing-plans</td><td>❌ 无</td></tr><tr><td><strong>子代理开发</strong></td><td>✅ subagent-driven-development</td><td>❌ 无</td></tr><tr><td><strong>GitHub 集成</strong></td><td>✅ 完整 PR&#x2F;Issue 工作流</td><td>基础</td></tr></tbody></table><h3 id="4-5-自动化"><a href="#4-5-自动化" class="headerlink" title="4.5 自动化"></a>4.5 自动化</h3><table><thead><tr><th>特性</th><th>Hermes Agent</th><th>OpenClaw</th></tr></thead><tbody><tr><td><strong>Cron 定时任务</strong></td><td>✅ 完整内置</td><td>✅ Cron Jobs</td></tr><tr><td><strong>Webhook</strong></td><td>✅</td><td>✅</td></tr><tr><td><strong>自然语言任务描述</strong></td><td>✅</td><td>❌</td></tr><tr><td><strong>多平台结果推送</strong></td><td>✅ 飞书&#x2F;微信&#x2F;Telegram</td><td>有限</td></tr><tr><td><strong>代码执行</strong></td><td>✅ 沙箱 Python RPC</td><td>❌</td></tr><tr><td><strong>Batch 处理</strong></td><td>✅ 并行批处理</td><td>❌ 无</td></tr></tbody></table><h3 id="4-6-媒体能力"><a href="#4-6-媒体能力" class="headerlink" title="4.6 媒体能力"></a>4.6 媒体能力</h3><table><thead><tr><th>特性</th><th>Hermes Agent</th><th>OpenClaw</th></tr></thead><tbody><tr><td><strong>语音模式</strong></td><td>✅ 完整语音对话</td><td>✅ Voice Wake and Talk</td></tr><tr><td><strong>Discord 语音</strong></td><td>✅</td><td>❌</td></tr><tr><td><strong>图片生成</strong></td><td>✅ 8 种模型</td><td>❌ 无</td></tr><tr><td><strong>Vision 多模态</strong></td><td>✅</td><td>基础</td></tr><tr><td><strong>浏览器自动化</strong></td><td>✅ 多后端</td><td>✅ CDP 集成</td></tr><tr><td><strong>YouTube 处理</strong></td><td>✅</td><td>❌ 无</td></tr><tr><td><strong>GIF 搜索</strong></td><td>✅</td><td>❌ 无</td></tr></tbody></table><h3 id="4-7-扩展性"><a href="#4-7-扩展性" class="headerlink" title="4.7 扩展性"></a>4.7 扩展性</h3><table><thead><tr><th>特性</th><th>Hermes Agent</th><th>OpenClaw</th></tr></thead><tbody><tr><td><strong>技能格式</strong></td><td>SKILL.md（agentskills.io 兼容）</td><td>ClawHub</td></tr><tr><td><strong>插件系统</strong></td><td>✅ Plugin Architecture</td><td>✅ Plugin SDK</td></tr><tr><td><strong>MCP 协议</strong></td><td>✅ 完整支持</td><td>❌ 无</td></tr><tr><td><strong>IDE 集成</strong></td><td>✅ VS Code &#x2F; Zed &#x2F; JetBrains（ACP）</td><td>❌ 无</td></tr><tr><td><strong>API Server</strong></td><td>✅ OpenAI 兼容</td><td>❌ 无</td></tr><tr><td><strong>Provider 路由</strong></td><td>✅ 多 Provider 智能路由</td><td>✅ Provider Failover</td></tr></tbody></table><hr><h2 id="5-记忆与学习系统"><a href="#5-记忆与学习系统" class="headerlink" title="5. 记忆与学习系统"></a>5. 记忆与学习系统</h2><h3 id="Hermes-的闭合学习循环"><a href="#Hermes-的闭合学习循环" class="headerlink" title="Hermes 的闭合学习循环"></a>Hermes 的闭合学习循环</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br></pre></td><td class="code"><pre><span class="line">用户交互</span><br><span class="line">   ↓</span><br><span class="line">经验积累</span><br><span class="line">   ↓</span><br><span class="line">技能自创建 ──→ 使用中持续改进</span><br><span class="line">   ↓</span><br><span class="line">知识持久化</span><br><span class="line">   ↓</span><br><span class="line">下次会话 recall</span><br><span class="line">   ↑</span><br><span class="line">（循环）</span><br></pre></td></tr></table></figure><p><strong>自改进机制的四个关键</strong>：</p><ul><li><strong>技能自创建</strong>（Skill Self-Improvement）：从每次交互中提炼可复用技能</li><li><strong>使用中持续改进</strong>（Nudges）：运行时主动优化已有技能</li><li><strong>主动持久化</strong>（nudges itself to persist knowledge）：不依赖用户触发</li><li><strong>历史搜索</strong>：FTS5 全文检索跨会话记忆</li></ul><h3 id="OpenClaw-的记忆"><a href="#OpenClaw-的记忆" class="headerlink" title="OpenClaw 的记忆"></a>OpenClaw 的记忆</h3><p>OpenClaw 没有学习机制——消息历史存入基础 SQLite，每次会话重新开始，上下文不跨会话传递。</p><hr><h2 id="6-技能系统对比"><a href="#6-技能系统对比" class="headerlink" title="6. 技能系统对比"></a>6. 技能系统对比</h2><h3 id="Hermes-技能系统"><a href="#Hermes-技能系统" class="headerlink" title="Hermes 技能系统"></a>Hermes 技能系统</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line">~/.hermes/skills/</span><br><span class="line">├── SKILL.md           # YAML frontmatter + Markdown</span><br><span class="line">├── references/        # 参考文档</span><br><span class="line">├── templates/         # 模板</span><br><span class="line">└── scripts/           # 脚本</span><br><span class="line"></span><br><span class="line"># agentskills.io 兼容标准</span><br></pre></td></tr></table></figure><p><strong>技能自动加载</strong>：智能匹配任务 → 自动加载相关技能 → 执行</p><p><strong>技能分类（50+）</strong>：</p><table><thead><tr><th>分类</th><th>代表方向</th></tr></thead><tbody><tr><td>software-development</td><td>TDD &#x2F; 调试 &#x2F; 计划 &#x2F; 审查</td></tr><tr><td>github</td><td>完整 PR&#x2F;Issue 工作流</td></tr><tr><td>mlops</td><td>训练 &#x2F; 推理 &#x2F; 评测 &#x2F; 云端部署</td></tr><tr><td>productivity</td><td>Notion &#x2F; Google Workspace &#x2F; PowerPoint</td></tr><tr><td>media</td><td>YouTube &#x2F; 音乐 &#x2F; GIF</td></tr><tr><td>autonomous-ai-agents</td><td>Claude Code &#x2F; Codex &#x2F; OpenCode</td></tr><tr><td>note-taking</td><td>Obsidian</td></tr><tr><td>research</td><td>arXiv &#x2F; 博客监控</td></tr><tr><td>social-media</td><td>X&#x2F;Twitter</td></tr></tbody></table><h3 id="OpenClaw-技能系统"><a href="#OpenClaw-技能系统" class="headerlink" title="OpenClaw 技能系统"></a>OpenClaw 技能系统</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line">workspace/skills/       # 工作区技能</span><br><span class="line">~/.agents/skills/       # 跨项目技能</span><br><span class="line">~/.openclaw/skills/     # 托管/共享技能</span><br><span class="line"></span><br><span class="line"># 来源：ClawHub 市场</span><br></pre></td></tr></table></figure><h3 id="技能对比"><a href="#技能对比" class="headerlink" title="技能对比"></a>技能对比</h3><table><thead><tr><th>维度</th><th>Hermes</th><th>OpenClaw</th></tr></thead><tbody><tr><td>格式标准化</td><td>✅ agentskills.io</td><td>社区格式</td></tr><tr><td>自动加载</td><td>✅ 智能匹配</td><td>手动加载</td></tr><tr><td>自改进</td><td>✅ 使用中持续改进</td><td>❌ 无</td></tr><tr><td>技能数量</td><td>50+</td><td>有限</td></tr><tr><td>技能分类</td><td>15+ 分类</td><td>扁平</td></tr></tbody></table><hr><h2 id="7-生态与扩展性"><a href="#7-生态与扩展性" class="headerlink" title="7. 生态与扩展性"></a>7. 生态与扩展性</h2><h3 id="Hermes-生态"><a href="#Hermes-生态" class="headerlink" title="Hermes 生态"></a>Hermes 生态</h3><table><thead><tr><th>类别</th><th>内容</th></tr></thead><tbody><tr><td><strong>Provider</strong></td><td>Nous Portal &#x2F; OpenRouter（200+）&#x2F; Anthropic &#x2F; NVIDIA NIM &#x2F; OpenAI &#x2F; Google &#x2F; Mistral &#x2F; Bedrock &#x2F; 任意 OpenAI 兼容端点</td></tr><tr><td><strong>插件</strong></td><td>Memory Provider &#x2F; Context Engine Plugin</td></tr><tr><td><strong>MCP</strong></td><td>完整 MCP 协议支持</td></tr><tr><td><strong>IDE</strong></td><td>VS Code &#x2F; Zed &#x2F; JetBrains（ACP）</td></tr><tr><td><strong>API</strong></td><td>OpenAI 兼容 HTTP endpoint</td></tr><tr><td><strong>RL</strong></td><td>轨迹数据生成用于强化学习</td></tr></tbody></table><h3 id="OpenClaw-生态"><a href="#OpenClaw-生态" class="headerlink" title="OpenClaw 生态"></a>OpenClaw 生态</h3><table><thead><tr><th>类别</th><th>内容</th></tr></thead><tbody><tr><td><strong>Provider</strong></td><td>OpenAI &#x2F; Anthropic &#x2F; Google &#x2F; Ollama 本地 &#x2F; 30+</td></tr><tr><td><strong>插件</strong></td><td>Plugin SDK</td></tr><tr><td><strong>应用</strong></td><td>macOS App &#x2F; iOS App &#x2F; Android App</td></tr><tr><td><strong>渠道</strong></td><td>20+ 消息平台</td></tr><tr><td><strong>技能市场</strong></td><td>ClawHub</td></tr></tbody></table><h3 id="扩展性对比"><a href="#扩展性对比" class="headerlink" title="扩展性对比"></a>扩展性对比</h3><table><thead><tr><th>能力</th><th>Hermes</th><th>OpenClaw</th></tr></thead><tbody><tr><td>MCP 协议</td><td>✅</td><td>❌</td></tr><tr><td>IDE 集成</td><td>✅ ACP</td><td>❌</td></tr><tr><td>API Server</td><td>✅ OpenAI 兼容</td><td>❌</td></tr><tr><td>本地运行</td><td>可选</td><td><strong>核心原则</strong></td></tr><tr><td>强化学习</td><td>✅ RL Research Environments</td><td>❌</td></tr><tr><td>技能市场</td><td>ClawHub（兼容）</td><td>✅</td></tr></tbody></table><hr><h2 id="8-适用场景分析"><a href="#8-适用场景分析" class="headerlink" title="8. 适用场景分析"></a>8. 适用场景分析</h2><h3 id="选-Hermes-Agent-当："><a href="#选-Hermes-Agent-当：" class="headerlink" title="选 Hermes Agent 当："></a>选 Hermes Agent 当：</h3><ul><li>需要<strong>飞书&#x2F;微信</strong>集成</li><li>需要 <strong>AI 自学习、自改进</strong>能力</li><li>需要 <strong>TDD、代码审查</strong>等工程实践</li><li>需要<strong>多子代理并行</strong>处理</li><li>需要 <strong>MCP 协议</strong>扩展</li><li>需要 <strong>RL 训练数据</strong>生成</li><li>需要 <strong>OpenAI 兼容 API</strong></li><li>需要 <strong>Vision &#x2F; 语音 &#x2F; 图片生成</strong></li><li>需要<strong>上下文压缩</strong>节省 token</li><li>追求<strong>活跃开发</strong>和持续新功能</li></ul><h3 id="选-OpenClaw-当："><a href="#选-OpenClaw-当：" class="headerlink" title="选 OpenClaw 当："></a>选 OpenClaw 当：</h3><ul><li>强需求<strong>本地运行</strong>（数据不离开机器）</li><li>需要 <strong>20+ 消息平台</strong>支持（含小众平台）</li><li>需要 <strong>macOS &#x2F; iOS &#x2F; Android</strong> 原生 App</li><li>熟悉 <strong>TypeScript&#x2F;JavaScript</strong> 生态</li><li>只需简单的<strong>消息 Bot</strong> 功能</li><li>偏好<strong>成熟稳定</strong>的早期项目</li></ul><hr><h2 id="9-总结"><a href="#9-总结" class="headerlink" title="9. 总结"></a>9. 总结</h2><h3 id="核心定位"><a href="#核心定位" class="headerlink" title="核心定位"></a>核心定位</h3><table><thead><tr><th></th><th>Hermes Agent</th><th>OpenClaw</th></tr></thead><tbody><tr><td><strong>Slogan</strong></td><td>“Self-improving AI agent”</td><td>“Local-first, multi-channel AI assistant”</td></tr><tr><td><strong>关键词</strong></td><td>学习 · 自改进 · 模型无关</td><td>本地 · 多渠道 · 插件化</td></tr><tr><td><strong>语言</strong></td><td>Python</td><td>TypeScript</td></tr><tr><td><strong>阶段</strong></td><td>活跃开发（v0.10.0）</td><td>成熟稳定</td></tr></tbody></table><h3 id="功能矩阵评分"><a href="#功能矩阵评分" class="headerlink" title="功能矩阵评分"></a>功能矩阵评分</h3><table><thead><tr><th>类别</th><th>Hermes</th><th>OpenClaw</th><th>胜出</th></tr></thead><tbody><tr><td>学习能力</td><td>★★★★★</td><td>★☆☆☆☆</td><td><strong>Hermes</strong></td></tr><tr><td>记忆系统</td><td>★★★★★</td><td>★★☆☆☆</td><td><strong>Hermes</strong></td></tr><tr><td>飞书&#x2F;微信</td><td>✅</td><td>❌</td><td><strong>Hermes</strong></td></tr><tr><td>本地化</td><td>★★★☆☆</td><td>★★★★★</td><td><strong>OpenClaw</strong></td></tr><tr><td>平台覆盖</td><td>★★★★☆</td><td>★★★★★</td><td><strong>OpenClaw</strong></td></tr><tr><td>开发工具</td><td>★★★★★</td><td>★★☆☆☆</td><td><strong>Hermes</strong></td></tr><tr><td>自动化</td><td>★★★★☆</td><td>★★★☆☆</td><td><strong>Hermes</strong></td></tr><tr><td>媒体能力</td><td>★★★★★</td><td>★★★☆☆</td><td><strong>Hermes</strong></td></tr><tr><td>扩展性</td><td>★★★★★</td><td>★★★★☆</td><td><strong>Hermes</strong></td></tr><tr><td>原生 App</td><td>❌</td><td>✅</td><td><strong>OpenClaw</strong></td></tr></tbody></table><h3 id="最终建议"><a href="#最终建议" class="headerlink" title="最终建议"></a>最终建议</h3><blockquote><p><strong>需要飞书&#x2F;微信，或需要 AI 自学习能力 → 选 Hermes Agent</strong><br><strong>强需本地运行、20+ 消息平台、原生移动 App → 选 OpenClaw</strong><br><strong>需要最强开发工具链（TDD &#x2F; 调试 &#x2F; 审查）→ 选 Hermes Agent</strong></p></blockquote><hr><p><em>数据来源：zread.ai&#x2F;NousResearch&#x2F;hermes-agent · zread.ai&#x2F;openclaw&#x2F;openclaw</em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/04/22/2026-04-22-hermes-vs-openclaw-zread-comparison/</id>
    <link href="https://iyangjialin.github.io/2026/04/22/2026-04-22-hermes-vs-openclaw-zread-comparison/"/>
    <published>2026-04-22T10:30:00.000Z</published>
    <summary>
      <![CDATA[<p>上一篇从迁移视角对比了 Hermes 与 OpenClaw，本篇直接对照两个项目的官方文档，从<strong>学习能力、架构设计、功能矩阵</strong>三个维度做更底层的分析。</p>
<blockquote>
<p>数据来源：<a href="https://zread.ai/NousResearch/hermes-agent">zread.ai&#x2F;NousResearch&#x2F;hermes-agent</a> · <a href="https://zread.ai/openclaw/openclaw">zread.ai&#x2F;openclaw&#x2F;openclaw</a><br>更新时间：2026-04-22</p>
</blockquote>]]>
    </summary>
    <title>Hermes Agent vs OpenClaw：基于官方文档的深度对比</title>
    <updated>2026-04-22T10:40:40.010Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="工具评测" scheme="https://iyangjialin.github.io/categories/%E5%B7%A5%E5%85%B7%E8%AF%84%E6%B5%8B/"/>
    <category term="OpenClaw" scheme="https://iyangjialin.github.io/tags/OpenClaw/"/>
    <category term="AI Agent" scheme="https://iyangjialin.github.io/tags/AI-Agent/"/>
    <category term="Hermes" scheme="https://iyangjialin.github.io/tags/Hermes/"/>
    <category term="工具对比" scheme="https://iyangjialin.github.io/tags/%E5%B7%A5%E5%85%B7%E5%AF%B9%E6%AF%94/"/>
    <content>
      <![CDATA[<p>OpenClaw（也叫 Clawdbot、Molbot）是许多人接触 AI Agent 的起点，而 Hermes Agent 正是它的官方继任者。本文从架构、记忆、技能、自动化、配置五个维度深入对比两者差异，并附完整迁移指南。</p><blockquote><p>版本说明：Hermes v0.10.0 | OpenClaw (legacy) — 更新于 2026-04-22</p></blockquote><span id="more"></span><hr><h2 id="1-背景关系"><a href="#1-背景关系" class="headerlink" title="1. 背景关系"></a>1. 背景关系</h2><h3 id="血缘关系"><a href="#血缘关系" class="headerlink" title="血缘关系"></a>血缘关系</h3><p>Hermes Agent 与 OpenClaw 有着直接的继承关系。OpenClaw 是早期项目，Hermes 是其继任者，官方提供了一键迁移工具：</p><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">hermes claw migrate</span><br></pre></td></tr></table></figure><h3 id="命名对应"><a href="#命名对应" class="headerlink" title="命名对应"></a>命名对应</h3><table><thead><tr><th>OpenClaw</th><th>Hermes</th><th>说明</th></tr></thead><tbody><tr><td><code>~/.openclaw/</code></td><td><code>~/.hermes/</code></td><td>主配置目录</td></tr><tr><td><code>clawdbot.json</code></td><td><code>config.yaml</code></td><td>主配置文件</td></tr><tr><td><code>workspace/SOUL.md</code></td><td><code>~/.hermes/SOUL.md</code></td><td>人格定义</td></tr><tr><td><code>workspace/MEMORY.md</code></td><td><code>~/.hermes/memories/MEMORY.md</code></td><td>长期记忆</td></tr><tr><td><code>workspace/AGENTS.md</code></td><td><code>AGENTS.md</code> (项目内)</td><td>Agent 指令</td></tr><tr><td><code>~/.agents/skills/</code></td><td><code>~/.hermes/skills/</code></td><td>技能目录</td></tr></tbody></table><hr><h2 id="2-核心架构对比"><a href="#2-核心架构对比" class="headerlink" title="2. 核心架构对比"></a>2. 核心架构对比</h2><table><thead><tr><th>维度</th><th>OpenClaw</th><th>Hermes Agent</th></tr></thead><tbody><tr><td><strong>编程语言</strong></td><td>Python</td><td>Python</td></tr><tr><td><strong>核心设计</strong></td><td>单体架构</td><td>模块化架构</td></tr><tr><td><strong>工具调用</strong></td><td>基础工具集</td><td>50+ 内置工具，可扩展</td></tr><tr><td><strong>子代理</strong></td><td>有限支持</td><td><code>delegate_task</code> 多子代理并行</td></tr><tr><td><strong>上下文压缩</strong></td><td>简单</td><td>自动上下文压缩 + 缓存</td></tr><tr><td><strong>前缀缓存</strong></td><td>无</td><td>Anthropic Prompt Caching 支持</td></tr><tr><td><strong>检查点&#x2F;回滚</strong></td><td>无</td><td>内置 <code>/rollback</code></td></tr><tr><td><strong>批量处理</strong></td><td>无</td><td><code>batch_runner.py</code> 并行处理</td></tr></tbody></table><h3 id="Hermes-独有特性"><a href="#Hermes-独有特性" class="headerlink" title="Hermes 独有特性"></a>Hermes 独有特性</h3><ul><li><strong>自动检查点</strong> — 文件修改前自动快照</li><li><strong>前缀缓存</strong> — 减少 token 消耗</li><li><strong>多子代理并行</strong> — 最多 3 个并发</li><li><strong>事件钩子系统</strong> — 生命周期自定义</li><li><strong>插件系统</strong> — Tool interception、Guardrails</li><li><strong>API Server</strong> — OpenAI 兼容接口</li><li><strong>IDE 集成 (ACP)</strong> — VS Code &#x2F; Zed &#x2F; JetBrains</li><li><strong>RL Training</strong> — 轨迹数据生成</li></ul><hr><h2 id="3-功能特性对比"><a href="#3-功能特性对比" class="headerlink" title="3. 功能特性对比"></a>3. 功能特性对比</h2><h3 id="3-1-记忆系统"><a href="#3-1-记忆系统" class="headerlink" title="3.1 记忆系统"></a>3.1 记忆系统</h3><table><thead><tr><th>特性</th><th>OpenClaw</th><th>Hermes</th></tr></thead><tbody><tr><td>MEMORY.md</td><td>✅</td><td>✅（增强）</td></tr><tr><td>USER.md</td><td>✅</td><td>✅（增强）</td></tr><tr><td>会话搜索</td><td>基础</td><td><strong>FTS5 全文搜索</strong> + LLM 摘要</td></tr><tr><td>外部记忆 Provider</td><td>无</td><td><strong>8 种</strong>（Honcho &#x2F; Mem0 &#x2F; Holographic…）</td></tr><tr><td>记忆容量管理</td><td>基础</td><td><strong>严格字符限制</strong> + 自动整合</td></tr><tr><td>安全扫描</td><td>无</td><td><strong>Prompt Injection 扫描</strong></td></tr></tbody></table><h3 id="3-2-技能系统"><a href="#3-2-技能系统" class="headerlink" title="3.2 技能系统"></a>3.2 技能系统</h3><table><thead><tr><th>特性</th><th>OpenClaw</th><th>Hermes</th></tr></thead><tbody><tr><td>技能格式</td><td>简单</td><td><strong>SKILL.md 标准格式</strong></td></tr><tr><td>技能市场</td><td>无</td><td><strong>agentskills.io 兼容</strong></td></tr><tr><td>技能自动加载</td><td>基础</td><td><strong>智能匹配 + 自动加载</strong></td></tr><tr><td>官方技能数量</td><td>少量</td><td><strong>50+ 内置技能</strong></td></tr><tr><td>技能分类</td><td>扁平</td><td><strong>15+ 分类</strong></td></tr></tbody></table><h3 id="3-3-自动化"><a href="#3-3-自动化" class="headerlink" title="3.3 自动化"></a>3.3 自动化</h3><table><thead><tr><th>特性</th><th>OpenClaw</th><th>Hermes</th></tr></thead><tbody><tr><td>定时任务（Cron）</td><td>外部</td><td><strong>内置完整 Cron 系统</strong></td></tr><tr><td>任务调度</td><td>无</td><td><strong>自然语言描述</strong></td></tr><tr><td>定时任务交付</td><td>有限</td><td><strong>多平台推送</strong>（飞书&#x2F;微信&#x2F;Telegram…）</td></tr><tr><td>代码执行</td><td>基础</td><td><strong>沙箱 Python RPC</strong></td></tr><tr><td>工作流编排</td><td>无</td><td><strong>子代理 + 事件钩子</strong></td></tr></tbody></table><h3 id="3-4-媒体与-Web"><a href="#3-4-媒体与-Web" class="headerlink" title="3.4 媒体与 Web"></a>3.4 媒体与 Web</h3><table><thead><tr><th>特性</th><th>OpenClaw</th><th>Hermes</th></tr></thead><tbody><tr><td>浏览器自动化</td><td>基础</td><td><strong>多后端</strong>（Browserbase &#x2F; Browser Use &#x2F; CDP &#x2F; Chromium）</td></tr><tr><td>语音模式</td><td>TTS 基础</td><td><strong>完整语音对话</strong></td></tr><tr><td>语音通话（Discord）</td><td>无</td><td>✅</td></tr><tr><td>图片生成</td><td>无</td><td><strong>8 种模型</strong>（FLUX &#x2F; GPT-Image &#x2F; Ideogram…）</td></tr><tr><td>Vision 多模态</td><td>基础</td><td><strong>增强 + clipboard paste</strong></td></tr><tr><td>YouTube 处理</td><td>无</td><td>✅</td></tr><tr><td>GIF 搜索</td><td>无</td><td>✅</td></tr></tbody></table><h3 id="3-5-开发工具"><a href="#3-5-开发工具" class="headerlink" title="3.5 开发工具"></a>3.5 开发工具</h3><table><thead><tr><th>特性</th><th>OpenClaw</th><th>Hermes</th></tr></thead><tbody><tr><td>GitHub 集成</td><td>基础</td><td><strong>完整 PR&#x2F;Issue 工作流</strong></td></tr><tr><td>代码审查</td><td>基础</td><td><strong>独立审查子代理 + 自动修复</strong></td></tr><tr><td>TDD 支持</td><td>无</td><td><strong>RED-GREEN-REFACTOR 流程</strong></td></tr><tr><td>系统调试</td><td>无</td><td><strong>4 阶段根因调查</strong></td></tr><tr><td>计划模式</td><td>无</td><td><strong>plan + writing-plans</strong></td></tr><tr><td>MCP 协议</td><td>无</td><td>✅</td></tr></tbody></table><hr><h2 id="4-记忆系统对比"><a href="#4-记忆系统对比" class="headerlink" title="4. 记忆系统对比"></a>4. 记忆系统对比</h2><h3 id="OpenClaw-记忆"><a href="#OpenClaw-记忆" class="headerlink" title="OpenClaw 记忆"></a>OpenClaw 记忆</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br></pre></td><td class="code"><pre><span class="line">workspace/MEMORY.md          # 每日记忆文件</span><br><span class="line">workspace/USER.md            # 用户画像</span><br><span class="line">workspace/memory/*.md        # 日记式记忆</span><br></pre></td></tr></table></figure><h3 id="Hermes-记忆（三层架构）"><a href="#Hermes-记忆（三层架构）" class="headerlink" title="Hermes 记忆（三层架构）"></a>Hermes 记忆（三层架构）</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br></pre></td><td class="code"><pre><span class="line">┌─────────────────────────────────────────┐</span><br><span class="line">│            SYSTEM PROMPT                 │</span><br><span class="line">│  SOUL.md (人格) │ MEMORY.md │ USER.md   │</span><br><span class="line">└─────────────────────────────────────────┘</span><br><span class="line">                    ↓</span><br><span class="line">         session_search (FTS5)</span><br><span class="line">                    ↓</span><br><span class="line">      外部 Provider (Honcho/Mem0/...)</span><br></pre></td></tr></table></figure><h3 id="关键改进"><a href="#关键改进" class="headerlink" title="关键改进"></a>关键改进</h3><table><thead><tr><th>改进点</th><th>OpenClaw</th><th>Hermes</th></tr></thead><tbody><tr><td>容量限制</td><td>无硬性限制</td><td><strong>严格字符限制防膨胀</strong></td></tr><tr><td>去重机制</td><td>无</td><td><strong>自动去重</strong></td></tr><tr><td>安全扫描</td><td>无</td><td><strong>Injection 扫描</strong></td></tr><tr><td>记忆融合</td><td>简单追加</td><td><strong>智能合并 + 整合</strong></td></tr><tr><td>搜索能力</td><td>无</td><td><strong>全文搜索 + LLM 摘要</strong></td></tr></tbody></table><hr><h2 id="5-技能系统对比"><a href="#5-技能系统对比" class="headerlink" title="5. 技能系统对比"></a>5. 技能系统对比</h2><h3 id="OpenClaw-技能"><a href="#OpenClaw-技能" class="headerlink" title="OpenClaw 技能"></a>OpenClaw 技能</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">workspace/skills/           # 工作区技能</span><br><span class="line">~/.agents/skills/           # 跨项目技能</span><br></pre></td></tr></table></figure><h3 id="Hermes-技能结构"><a href="#Hermes-技能结构" class="headerlink" title="Hermes 技能结构"></a>Hermes 技能结构</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br></pre></td><td class="code"><pre><span class="line">~/.hermes/skills/</span><br><span class="line">├── SKILL.md                # 技能定义（YAML frontmatter + Markdown）</span><br><span class="line">├── references/             # 参考文档</span><br><span class="line">├── templates/              # 模板文件</span><br><span class="line">└── scripts/                # 脚本</span><br></pre></td></tr></table></figure><h3 id="技能文件格式（SKILL-md）"><a href="#技能文件格式（SKILL-md）" class="headerlink" title="技能文件格式（SKILL.md）"></a>技能文件格式（SKILL.md）</h3><figure class="highlight yaml"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br></pre></td><td class="code"><pre><span class="line"><span class="meta">---</span></span><br><span class="line"><span class="attr">name:</span> <span class="string">my-skill</span></span><br><span class="line"><span class="attr">description:</span> <span class="string">技能描述</span></span><br><span class="line"><span class="attr">version:</span> <span class="number">1.0</span><span class="number">.0</span></span><br><span class="line"><span class="attr">tags:</span> [<span class="string">tag1</span>, <span class="string">tag2</span>]</span><br><span class="line"><span class="attr">related_skills:</span> [<span class="string">other-skill</span>]</span><br><span class="line"><span class="meta">---</span></span><br><span class="line"><span class="meta"></span></span><br><span class="line"><span class="comment"># 技能名称</span></span><br><span class="line"></span><br><span class="line"><span class="comment">## 触发条件</span></span><br><span class="line"><span class="string">何时使用此技能</span></span><br><span class="line"></span><br><span class="line"><span class="comment">## 使用步骤</span></span><br><span class="line"><span class="number">1</span><span class="string">.</span> <span class="string">步骤一</span></span><br><span class="line"><span class="number">2</span><span class="string">.</span> <span class="string">步骤二</span></span><br></pre></td></tr></table></figure><h3 id="Hermes-技能分类（50-）"><a href="#Hermes-技能分类（50-）" class="headerlink" title="Hermes 技能分类（50+）"></a>Hermes 技能分类（50+）</h3><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br></pre></td><td class="code"><pre><span class="line">├── software-development/     # TDD、调试、计划、审查</span><br><span class="line">├── github/                   # GitHub 全套</span><br><span class="line">├── devops/                   # Webhook</span><br><span class="line">├── mlops/                    # 训练、推理、评测</span><br><span class="line">│   ├── models/               # CLIP / Whisper / Stable Diffusion</span><br><span class="line">│   ├── training/             # Axolotl / TRL / Unsloth</span><br><span class="line">│   ├── inference/            # vLLM / llama.cpp / GGUF</span><br><span class="line">│   └── evaluation/           # lm-evaluation-harness / W&amp;B</span><br><span class="line">├── productivity/             # Notion / Google Workspace / PowerPoint</span><br><span class="line">├── media/                    # YouTube / 音乐 / GIF</span><br><span class="line">├── creative/                 # ASCII 艺术 / 文生图</span><br><span class="line">├── gaming/                   # Minecraft / Pokemon</span><br><span class="line">├── autonomous-ai-agents/     # Claude Code / Codex / OpenCode</span><br><span class="line">├── note-taking/              # Obsidian</span><br><span class="line">├── research/                 # arXiv / 博客监控</span><br><span class="line">└── social-media/             # X/Twitter</span><br></pre></td></tr></table></figure><hr><h2 id="6-配置体系对比"><a href="#6-配置体系对比" class="headerlink" title="6. 配置体系对比"></a>6. 配置体系对比</h2><h3 id="OpenClaw-配置"><a href="#OpenClaw-配置" class="headerlink" title="OpenClaw 配置"></a>OpenClaw 配置</h3><figure class="highlight json"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// clawdbot.json</span></span><br><span class="line"><span class="punctuation">&#123;</span></span><br><span class="line">  <span class="attr">&quot;agents&quot;</span><span class="punctuation">:</span> <span class="punctuation">&#123;</span></span><br><span class="line">    <span class="attr">&quot;defaults&quot;</span><span class="punctuation">:</span> <span class="punctuation">&#123;</span></span><br><span class="line">      <span class="attr">&quot;model&quot;</span><span class="punctuation">:</span> <span class="string">&quot;claude-3-5-sonnet&quot;</span><span class="punctuation">,</span></span><br><span class="line">      <span class="attr">&quot;timeoutSeconds&quot;</span><span class="punctuation">:</span> <span class="number">300</span></span><br><span class="line">    <span class="punctuation">&#125;</span></span><br><span class="line">  <span class="punctuation">&#125;</span><span class="punctuation">,</span></span><br><span class="line">  <span class="attr">&quot;channels&quot;</span><span class="punctuation">:</span> <span class="punctuation">&#123;</span><span class="punctuation">&#125;</span><span class="punctuation">,</span></span><br><span class="line">  <span class="attr">&quot;mcp&quot;</span><span class="punctuation">:</span> <span class="punctuation">&#123;</span><span class="punctuation">&#125;</span></span><br><span class="line"><span class="punctuation">&#125;</span></span><br></pre></td></tr></table></figure><h3 id="Hermes-配置"><a href="#Hermes-配置" class="headerlink" title="Hermes 配置"></a>Hermes 配置</h3><figure class="highlight yaml"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># config.yaml</span></span><br><span class="line"><span class="attr">agent:</span></span><br><span class="line">  <span class="attr">max_turns:</span> <span class="number">60</span></span><br><span class="line">  <span class="attr">verbose:</span> <span class="string">off</span></span><br><span class="line">  <span class="attr">reasoning_effort:</span> <span class="string">medium</span></span><br><span class="line"></span><br><span class="line"><span class="attr">memory:</span></span><br><span class="line">  <span class="attr">memory_enabled:</span> <span class="literal">true</span></span><br><span class="line">  <span class="attr">user_profile_enabled:</span> <span class="literal">true</span></span><br><span class="line">  <span class="attr">memory_char_limit:</span> <span class="number">2200</span></span><br><span class="line">  <span class="attr">user_char_limit:</span> <span class="number">1375</span></span><br><span class="line"></span><br><span class="line"><span class="attr">providers:</span></span><br><span class="line">  <span class="attr">primary:</span> <span class="string">anthropic</span></span><br><span class="line">  <span class="attr">fallbacks:</span></span><br><span class="line">    <span class="bullet">-</span> <span class="string">openrouter</span></span><br><span class="line">    <span class="bullet">-</span> <span class="string">google</span></span><br><span class="line"></span><br><span class="line"><span class="attr">platforms:</span></span><br><span class="line">  <span class="attr">feishu:</span></span><br><span class="line">    <span class="attr">enabled:</span> <span class="literal">true</span></span><br><span class="line">  <span class="attr">weixin:</span></span><br><span class="line">    <span class="attr">enabled:</span> <span class="literal">true</span></span><br></pre></td></tr></table></figure><h3 id="配置迁移映射"><a href="#配置迁移映射" class="headerlink" title="配置迁移映射"></a>配置迁移映射</h3><table><thead><tr><th>OpenClaw</th><th>Hermes</th><th>备注</th></tr></thead><tbody><tr><td><code>agents.defaults.model</code></td><td><code>model</code></td><td>直接映射</td></tr><tr><td><code>agents.defaults.timeoutSeconds</code></td><td><code>agent.max_turns</code></td><td>值除以 10</td></tr><tr><td><code>agents.defaults.sandbox.backend</code></td><td><code>terminal.backend</code></td><td></td></tr><tr><td><code>session.reset.mode</code></td><td><code>session_reset.mode</code></td><td></td></tr><tr><td><code>mcp.servers.*</code></td><td><code>mcp_servers.*</code></td><td>直接映射</td></tr><tr><td><code>browser.cdpUrl</code></td><td><code>browser.cdp_url</code></td><td></td></tr><tr><td><code>approvals.exec.mode</code></td><td><code>approvals.mode</code></td><td>值映射</td></tr></tbody></table><hr><h2 id="7-消息平台支持"><a href="#7-消息平台支持" class="headerlink" title="7. 消息平台支持"></a>7. 消息平台支持</h2><table><thead><tr><th>平台</th><th>OpenClaw</th><th>Hermes</th></tr></thead><tbody><tr><td><strong>飞书</strong></td><td>有限</td><td>✅ 完整支持</td></tr><tr><td><strong>微信</strong></td><td>有限</td><td>✅ 完整支持</td></tr><tr><td>Telegram</td><td>✅</td><td>✅</td></tr><tr><td>Discord</td><td>✅</td><td>✅</td></tr><tr><td>Slack</td><td>✅</td><td>✅</td></tr><tr><td>WhatsApp</td><td>✅</td><td>✅</td></tr><tr><td>Signal</td><td>✅</td><td>✅</td></tr><tr><td>Matrix</td><td>✅</td><td>✅</td></tr><tr><td>Mattermost</td><td>✅</td><td>✅</td></tr><tr><td>Home Assistant</td><td>有限</td><td>✅</td></tr><tr><td>自建 Web</td><td>无</td><td>✅ API Server</td></tr></tbody></table><h3 id="Hermes-独有接入"><a href="#Hermes-独有接入" class="headerlink" title="Hermes 独有接入"></a>Hermes 独有接入</h3><ul><li><strong>飞书 &#x2F; 微信</strong> 完整集成</li><li><strong>Open WebUI &#x2F; LobeChat &#x2F; LibreChat</strong> 支持</li><li><strong>VS Code &#x2F; Zed &#x2F; JetBrains</strong> 集成（ACP 协议）</li></ul><hr><h2 id="8-迁移指南"><a href="#8-迁移指南" class="headerlink" title="8. 迁移指南"></a>8. 迁移指南</h2><h3 id="一键迁移"><a href="#一键迁移" class="headerlink" title="一键迁移"></a>一键迁移</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment"># 预览迁移内容</span></span><br><span class="line">hermes claw migrate --dry-run</span><br><span class="line"></span><br><span class="line"><span class="comment"># 完整迁移（包含密钥）</span></span><br><span class="line">hermes claw migrate --preset full --<span class="built_in">yes</span></span><br><span class="line"></span><br><span class="line"><span class="comment"># 仅迁移用户数据（不含密钥）</span></span><br><span class="line">hermes claw migrate --preset user-data</span><br></pre></td></tr></table></figure><h3 id="迁移内容清单"><a href="#迁移内容清单" class="headerlink" title="迁移内容清单"></a>迁移内容清单</h3><table><thead><tr><th>内容</th><th>状态</th></tr></thead><tbody><tr><td>SOUL.md</td><td>✅ 自动迁移</td></tr><tr><td>MEMORY.md &#x2F; USER.md</td><td>✅ 自动迁移 + 合并去重</td></tr><tr><td>技能</td><td>✅ 迁移到 <code>skills/openclaw-imports/</code></td></tr><tr><td>模型配置</td><td>✅</td></tr><tr><td>MCP 服务器</td><td>✅</td></tr><tr><td>TTS 设置</td><td>✅</td></tr><tr><td>消息平台 Token</td><td>✅（需要 <code>--preset full</code>）</td></tr><tr><td>Cron 任务</td><td>⚠️ 需手动重建</td></tr><tr><td>插件</td><td>⚠️ 需手动配置</td></tr><tr><td>HEARTBEAT &#x2F; BOOTSTRAP</td><td>⚠️ 存档后手动处理</td></tr></tbody></table><h3 id="迁移后检查"><a href="#迁移后检查" class="headerlink" title="迁移后检查"></a>迁移后检查</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line">hermes status              <span class="comment"># 检查 API 认证</span></span><br><span class="line">hermes memory status       <span class="comment"># 查看记忆状态</span></span><br><span class="line">hermes skills list         <span class="comment"># 确认技能加载</span></span><br><span class="line">systemctl --user restart hermes-gateway   <span class="comment"># 重启网关</span></span><br></pre></td></tr></table></figure><hr><h2 id="9-总结"><a href="#9-总结" class="headerlink" title="9. 总结"></a>9. 总结</h2><h3 id="何时选-Hermes"><a href="#何时选-Hermes" class="headerlink" title="何时选 Hermes"></a>何时选 Hermes</h3><p>如果你有以下任意一项需求，Hermes 都是更好的选择：</p><ul><li>需要<strong>飞书&#x2F;微信</strong>原生集成</li><li>需要<strong>多子代理</strong>并行处理复杂任务</li><li>需要 <strong>TDD &#x2F; 系统调试 &#x2F; 代码审查</strong>等工程实践</li><li>需要<strong>定时任务 + 多平台推送</strong></li><li>需要<strong>图片生成 &#x2F; 语音对话</strong></li><li>需要 <strong>MCP 协议</strong>支持</li><li>需要 <strong>RL 训练数据</strong>生成</li><li>想要持续更新和新功能</li></ul><h3 id="核心差异总结"><a href="#核心差异总结" class="headerlink" title="核心差异总结"></a>核心差异总结</h3><table><thead><tr><th>维度</th><th>OpenClaw</th><th>Hermes</th></tr></thead><tbody><tr><td><strong>定位</strong></td><td>基础 Agent</td><td><strong>全能助手平台</strong></td></tr><tr><td><strong>技能生态</strong></td><td>简单</td><td><strong>50+ 官方技能</strong></td></tr><tr><td><strong>自动化</strong></td><td>基础</td><td><strong>完整 Cron + Hooks</strong></td></tr><tr><td><strong>记忆</strong></td><td>文件式</td><td><strong>三层架构 + Provider</strong></td></tr><tr><td><strong>开发工具</strong></td><td>基础</td><td><strong>TDD &#x2F; 调试 &#x2F; 审查 &#x2F; 计划</strong></td></tr><tr><td><strong>媒体</strong></td><td>有限</td><td><strong>语音 &#x2F; 图像 &#x2F; 视频</strong></td></tr><tr><td><strong>扩展性</strong></td><td>有限</td><td><strong>插件 + MCP</strong></td></tr><tr><td><strong>活跃度</strong></td><td>维护中</td><td><strong>活跃开发</strong></td></tr></tbody></table><h3 id="从-OpenClaw-迁移的理由"><a href="#从-OpenClaw-迁移的理由" class="headerlink" title="从 OpenClaw 迁移的理由"></a>从 OpenClaw 迁移的理由</h3><ol><li><strong>飞书&#x2F;微信原生支持</strong> — OpenClaw 有限，Hermes 完整集成</li><li><strong>活跃开发</strong> — 新功能持续更新</li><li><strong>更完善的工程实践</strong> — TDD、调试、代码审查内置</li><li><strong>更强大的记忆</strong> — 三层架构 + 外部 Provider</li><li><strong>多子代理</strong> — 复杂任务并行处理</li><li><strong>完整自动化</strong> — Cron + Hooks + 事件驱动</li></ol><hr><p><em>数据来源：Hermes Agent 官方文档 v0.10.0</em></p>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/04/22/2026-04-22-hermes-vs-openclaw-comparison/</id>
    <link href="https://iyangjialin.github.io/2026/04/22/2026-04-22-hermes-vs-openclaw-comparison/"/>
    <published>2026-04-22T10:00:00.000Z</published>
    <summary>
      <![CDATA[<p>OpenClaw（也叫 Clawdbot、Molbot）是许多人接触 AI Agent 的起点，而 Hermes Agent 正是它的官方继任者。本文从架构、记忆、技能、自动化、配置五个维度深入对比两者差异，并附完整迁移指南。</p>
<blockquote>
<p>版本说明：Hermes v0.10.0 | OpenClaw (legacy) — 更新于 2026-04-22</p>
</blockquote>]]>
    </summary>
    <title>Hermes Agent vs OpenClaw：一次彻底的架构进化</title>
    <updated>2026-04-22T10:35:16.635Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="深度思考" scheme="https://iyangjialin.github.io/categories/%E6%B7%B1%E5%BA%A6%E6%80%9D%E8%80%83/"/>
    <category term="AI" scheme="https://iyangjialin.github.io/tags/AI/"/>
    <category term="Satya Nadella" scheme="https://iyangjialin.github.io/tags/Satya-Nadella/"/>
    <category term="职业发展" scheme="https://iyangjialin.github.io/tags/%E8%81%8C%E4%B8%9A%E5%8F%91%E5%B1%95/"/>
    <content>
      <![CDATA[<blockquote><p>Satya Nadella 思想的核心——**AI 不是替代人，而是重新定义”人该做什么”**。</p><p>这不是效率革命，而是”认知权力”的重新分配。</p></blockquote><p>本文从三个维度，拆解 AI 重塑工作与公司价值的底层逻辑。</p><span id="more"></span><hr><h2 id="一、不是”人是混乱的”，而是”组织无法编码人”"><a href="#一、不是”人是混乱的”，而是”组织无法编码人”" class="headerlink" title="一、不是”人是混乱的”，而是”组织无法编码人”"></a>一、不是”人是混乱的”，而是”组织无法编码人”</h2><p>过去公司最大的问题，不是没有数据，而是**”人的经验无法被机器理解”**。</p><p>从 Bill Gates 的”信息尽在指尖”，到今天大模型：</p><ul><li><strong>过去</strong>：数据 &#x3D; 结构化表格（ERP &#x2F; CRM）</li><li><strong>现在</strong>：数据 &#x3D; 一切（会议、聊天、代码、邮件、脑子里的经验）</li></ul><p>关键变化是：</p><blockquote><p>AI 第一次让”非结构化认知”变成”可计算资产”</p></blockquote><p>这带来一个非常现实的变化：</p><ul><li>老员工的价值，不再只是”经验”</li><li>而是：<strong>能否被沉淀为组织的 AI 能力</strong></li></ul><p><strong>结论（很关键）：未来淘汰的不是能力弱的人，而是”不可被 AI 放大的人”。</strong></p><hr><h2 id="二、不是”宏观委托-微观驾驭”，而是”认知接口重构”"><a href="#二、不是”宏观委托-微观驾驭”，而是”认知接口重构”" class="headerlink" title="二、不是”宏观委托 + 微观驾驭”，而是”认知接口重构”"></a>二、不是”宏观委托 + 微观驾驭”，而是”认知接口重构”</h2><p>“AI 指挥官”这个词是对的，但还不够彻底。升级一个模型：</p><blockquote><p><strong>人 &#x3D; Prompt + Judgment + Feedback Loop</strong></p></blockquote><p>未来工作流不是”人 → 做事”，而是：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line">人 → 定义问题（Prompt）</span><br><span class="line">AI → 执行探索</span><br><span class="line">人 → 判断与修正（Judgment）</span><br><span class="line">AI → 继续迭代（Loop）</span><br></pre></td></tr></table></figure><hr><h3 id="真正的分水岭，不是会不会用-AI"><a href="#真正的分水岭，不是会不会用-AI" class="headerlink" title="真正的分水岭，不是会不会用 AI"></a>真正的分水岭，不是会不会用 AI</h3><p>而是：<strong>你能不能定义一个”好问题”</strong></p><p>同样一句话”分析下季度市场策略”，不同人差距会极大：</p><ul><li><strong>普通人</strong>：一句模糊指令 → 得到泛化答案</li><li><strong>高手</strong>拆成：<ul><li>市场分层（区域 &#x2F; 人群）</li><li>增长变量（价格 &#x2F; 渠道 &#x2F; 产品）</li><li>风险假设（竞争 &#x2F; 政策）</li><li>数据来源约束</li></ul></li></ul><p><strong>本质差异：不是 AI 强不强，而是你的”问题建模能力”强不强。</strong></p><hr><h2 id="三、不是”基础模型主权”，而是”认知资产资本化”"><a href="#三、不是”基础模型主权”，而是”认知资产资本化”" class="headerlink" title="三、不是”基础模型主权”，而是”认知资产资本化”"></a>三、不是”基础模型主权”，而是”认知资产资本化”</h2><p>企业真正的护城河，不是模型，而是**”被模型吃进去的数据结构”**。</p><p>三层护城河正在形成：</p><h3 id="第一层：公共层（被抹平）"><a href="#第一层：公共层（被抹平）" class="headerlink" title="第一层：公共层（被抹平）"></a>第一层：公共层（被抹平）</h3><ul><li>开源模型</li><li>API 能力<br>→ everyone can access</li></ul><h3 id="第二层：应用层（短期竞争）"><a href="#第二层：应用层（短期竞争）" class="headerlink" title="第二层：应用层（短期竞争）"></a>第二层：应用层（短期竞争）</h3><ul><li>AI 工具</li><li>Agent 产品<br>→ 很快同质化</li></ul><h3 id="第三层：核心层（真正壁垒）"><a href="#第三层：核心层（真正壁垒）" class="headerlink" title="第三层：核心层（真正壁垒）"></a>第三层：核心层（真正壁垒）</h3><p><strong>组织内部认知资产</strong>，包括：</p><ul><li>客户行为数据</li><li>决策逻辑</li><li>风控规则</li><li>成功 &#x2F; 失败案例</li></ul><p>所以真正的问题不是”有没有 AI”，而是：</p><blockquote><p><strong>“你的公司有没有可被 AI 学习的知识体系？”</strong></p></blockquote><hr><h2 id="四、一个最关键的风险"><a href="#四、一个最关键的风险" class="headerlink" title="四、一个最关键的风险"></a>四、一个最关键的风险</h2><blockquote><p><strong>大部分公司，根本没有”可沉淀的知识”。</strong></p></blockquote><p>现实情况是：</p><ul><li>决策靠拍脑袋</li><li>流程不标准</li><li>数据不干净</li><li>经验在个人脑子里</li></ul><p>这种公司即使接入 AI，只会”放大混乱”，而不是”提升效率”。</p><hr><h2 id="五、AI-时代的三次”角色跃迁”"><a href="#五、AI-时代的三次”角色跃迁”" class="headerlink" title="五、AI 时代的三次”角色跃迁”"></a>五、AI 时代的三次”角色跃迁”</h2><table><thead><tr><th>阶段</th><th>转变</th><th>淘汰逻辑</th></tr></thead><tbody><tr><td>第一跃迁</td><td>执行者 → 问题定义者</td><td>不会问问题 &#x3D; 被淘汰</td></tr><tr><td>第二跃迁</td><td>经验拥有者 → 认知产品经理</td><td>不能沉淀经验 &#x3D; 价值下降</td></tr><tr><td>第三跃迁</td><td>工具使用者 → 系统设计者</td><td>不会构建 AI 工作流 &#x3D; 上限封死</td></tr></tbody></table><hr><h2 id="六、一个”行动级建议”"><a href="#六、一个”行动级建议”" class="headerlink" title="六、一个”行动级建议”"></a>六、一个”行动级建议”</h2><p>对于关注 AI + 项目管理的人，可以做一件非常具体的事：</p><h3 id="建一个”AI-项目管理操作系统”"><a href="#建一个”AI-项目管理操作系统”" class="headerlink" title="建一个”AI 项目管理操作系统”"></a>建一个”AI 项目管理操作系统”</h3><p>包含：</p><ul><li><strong>项目复盘</strong> → 喂给 AI（沉淀经验）</li><li><strong>风险识别</strong> → 做成提示词模板</li><li><strong>需求分析</strong> → 结构化输入 AI</li><li><strong>自动生成</strong>：周报、风险清单、里程碑规划</li></ul><p>本质是在做一件事：</p><blockquote><p><strong>把你的”项目管理经验”，变成”AI 可复用能力”</strong></p></blockquote><hr><blockquote><p><strong>AI 不会取代人，但会取代”无法被 AI 放大的那部分人”。</strong></p></blockquote>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/04/11/2026-04-11-ai-redefining-what-humans-do/</id>
    <link href="https://iyangjialin.github.io/2026/04/11/2026-04-11-ai-redefining-what-humans-do/"/>
    <published>2026-04-11T03:44:00.000Z</published>
    <summary>
      <![CDATA[<blockquote>
<p>Satya Nadella 思想的核心——**AI 不是替代人，而是重新定义”人该做什么”**。</p>
<p>这不是效率革命，而是”认知权力”的重新分配。</p>
</blockquote>
<p>本文从三个维度，拆解 AI 重塑工作与公司价值的底层逻辑。</p>]]>
    </summary>
    <title>AI不是替代人，而是重新定义「人该做什么」</title>
    <updated>2026-04-11T03:50:30.039Z</updated>
  </entry>
  <entry>
    <author>
      <name>John Doe</name>
    </author>
    <category term="深度思考" scheme="https://iyangjialin.github.io/categories/%E6%B7%B1%E5%BA%A6%E6%80%9D%E8%80%83/"/>
    <category term="AI" scheme="https://iyangjialin.github.io/tags/AI/"/>
    <category term="商业洞察" scheme="https://iyangjialin.github.io/tags/%E5%95%86%E4%B8%9A%E6%B4%9E%E5%AF%9F/"/>
    <category term="Satya Nadella" scheme="https://iyangjialin.github.io/tags/Satya-Nadella/"/>
    <content>
      <![CDATA[<blockquote><p>这篇来自 Cheeky Pint 的访谈，本质上是一次非常”纳德拉式”的认知输出——不是讲 AI 技术，而是在讲**公司如何在 AI 时代重新定义”存在方式”**。</p></blockquote><p>本文分三层拆解：<strong>他说了什么 → 真正隐含的逻辑 → 我的判断</strong>。</p><span id="more"></span><hr><h2 id="一、他到底在说什么（核心观点还原）"><a href="#一、他到底在说什么（核心观点还原）" class="headerlink" title="一、他到底在说什么（核心观点还原）"></a>一、他到底在说什么（核心观点还原）</h2><p>主角：Satya Nadella</p><h3 id="1-公司正在从”人-流程”-转向-“模型-知识”"><a href="#1-公司正在从”人-流程”-转向-“模型-知识”" class="headerlink" title="1. 公司正在从”人 + 流程” 转向 “模型 + 知识”"></a>1. 公司正在从”人 + 流程” 转向 “模型 + 知识”</h3><p>他提出一个非常关键的点：</p><blockquote><p>企业的”主权”（sovereignty），未来在于是否拥有自己的基础模型</p></blockquote><p>本质是：</p><ul><li><strong>过去</strong>：公司 &#x3D; 人 + SOP + 文档</li><li><strong>现在</strong>：公司 &#x3D; <strong>embedding + 权重 + agent 系统</strong></li></ul><p>甚至他说：企业知识会变成”模型里的权重”[<a href="https://cheekypint.transistor.fm/19/transcript">Cheeky Pint</a>]。</p><hr><h3 id="2-AI-系统-≠-模型，而是”三件套”"><a href="#2-AI-系统-≠-模型，而是”三件套”" class="headerlink" title="2. AI 系统 ≠ 模型，而是”三件套”"></a>2. AI 系统 ≠ 模型，而是”三件套”</h3><p>AI 要落地，必须有三层：</p><ul><li><strong>Memory</strong>（记忆）</li><li><strong>Entitlements</strong>（权限）</li><li><strong>Actions</strong>（行动能力）</li></ul><p>模型只是”大脑”，这三者才是”身体”[<a href="https://cheekypint.transistor.fm/19/transcript">Cheeky Pint</a>]。</p><hr><h3 id="3-AI-不是泡沫，反而是供给不足"><a href="#3-AI-不是泡沫，反而是供给不足" class="headerlink" title="3. AI 不是泡沫，反而是供给不足"></a>3. AI 不是泡沫，反而是供给不足</h3><p>他给了一个<strong>反直觉判断</strong>：</p><ul><li>互联网泡沫：基础设施过剩（dark fiber）</li><li>AI 时代：<strong>算力严重不够</strong></li></ul><blockquote><p>“没有任何资源是闲置的，全部卖光”</p></blockquote><hr><h3 id="4-模块化-一体化（非常反直觉）"><a href="#4-模块化-一体化（非常反直觉）" class="headerlink" title="4. 模块化 &gt; 一体化（非常反直觉）"></a>4. 模块化 &gt; 一体化（非常反直觉）</h3><blockquote><p><strong>不是封闭平台赢，而是模块化组合赢</strong></p></blockquote><p>比如：</p><ul><li>多模型（OpenAI + Claude 等）</li><li>agent 作为调度层[<a href="https://cheekypint.transistor.fm/19/transcript">Cheeky Pint</a>]</li></ul><hr><h3 id="5-AI-的终极形态：Agent-Commerce"><a href="#5-AI-的终极形态：Agent-Commerce" class="headerlink" title="5. AI 的终极形态：Agent + Commerce"></a>5. AI 的终极形态：Agent + Commerce</h3><p>他提到一个关键词：</p><blockquote><p><strong>agentic commerce（智能体驱动商业）</strong></p></blockquote><p>意味着：</p><ul><li>用户不再”操作软件”</li><li>agent 直接替你完成决策和交易</li></ul><hr><h2 id="二、真正厉害的地方（很多人没看懂）"><a href="#二、真正厉害的地方（很多人没看懂）" class="headerlink" title="二、真正厉害的地方（很多人没看懂）"></a>二、真正厉害的地方（很多人没看懂）</h2><p>这篇文章真正厉害的，不是观点，而是<strong>范式迁移</strong>。</p><hr><h3 id="公司-“可计算系统”"><a href="#公司-“可计算系统”" class="headerlink" title="公司 &#x3D; “可计算系统”"></a>公司 &#x3D; “可计算系统”</h3><p>他在干一件很颠覆的事：<strong>把”公司”从组织，变成一个计算结构</strong></p><p>传统公司：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">人 → 沟通 → 决策 → 执行</span><br></pre></td></tr></table></figure><p>未来公司：</p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">数据 → 模型 → agent → 自动执行</span><br></pre></td></tr></table></figure><p>这就是：<strong>Company as a Model（公司即模型）</strong></p><hr><h3 id="知识第一次被”编译”"><a href="#知识第一次被”编译”" class="headerlink" title="知识第一次被”编译”"></a>知识第一次被”编译”</h3><table><thead><tr><th>过去</th><th>现在</th></tr></thead><tbody><tr><td>知识在脑子里（不可复制）</td><td>直接进入模型（embedding &#x2F; weights）</td></tr><tr><td>写成文档（低效）</td><td>可复制</td></tr><tr><td>做成流程（僵化）</td><td>可推理、可自动执行</td></tr></tbody></table><p>这是”知识工业化”的开始。</p><hr><h3 id="护城河彻底变了"><a href="#护城河彻底变了" class="headerlink" title="护城河彻底变了"></a>护城河彻底变了</h3><p>传统护城河：技术 → 产品 → 渠道</p><p>纳德拉的判断：<strong>未来护城河 &#x3D; 你的数据 + 你的模型 + 你的 agent 系统</strong></p><p>甚至可以推导出一句话：</p><blockquote><p>模型是公共的，<strong>系统才是壁垒</strong></p></blockquote><hr><h3 id="为什么他说”模块化更强”"><a href="#为什么他说”模块化更强”" class="headerlink" title="为什么他说”模块化更强”"></a>为什么他说”模块化更强”</h3><p>模型会商品化（commodity）。所以：</p><ul><li>你不能押宝单一模型</li><li>必须做”调度层”（agent + orchestration）</li></ul><p>这就是微软在做的：</p><ul><li><strong>Copilot</strong> &#x3D; UI</li><li><strong>Azure</strong> &#x3D; infra</li><li><strong>agent</strong> &#x3D; 中间层</li></ul><hr><h2 id="三、我对这篇的判断"><a href="#三、我对这篇的判断" class="headerlink" title="三、我对这篇的判断"></a>三、我对这篇的判断</h2><blockquote><p><strong>这篇不是观点，而是”路线图”——微软未来 10 年的路线图</strong></p></blockquote><hr><h3 id="判断-1：他已经默认”AGI-不重要”"><a href="#判断-1：他已经默认”AGI-不重要”" class="headerlink" title="判断 1：他已经默认”AGI 不重要”"></a>判断 1：他已经默认”AGI 不重要”</h3><p>他完全不谈 AGI、超智能，只关心<strong>有没有产生价值</strong>。这和很多 AI 公司完全不同。</p><hr><h3 id="判断-2：真正的战争不在模型层"><a href="#判断-2：真正的战争不在模型层" class="headerlink" title="判断 2：真正的战争不在模型层"></a>判断 2：真正的战争不在模型层</h3><p>模型可以替换（ensemble of models）。所以战争在：</p><ul><li>数据层</li><li>权限层</li><li>工作流层</li><li>agent 层</li></ul><hr><h3 id="判断-3：他在定义”AI-时代的操作系统”"><a href="#判断-3：他在定义”AI-时代的操作系统”" class="headerlink" title="判断 3：他在定义”AI 时代的操作系统”"></a>判断 3：他在定义”AI 时代的操作系统”</h3><p>微软在做的其实是：<strong>企业级 AI OS</strong></p><figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line">模型（OpenAI / Claude / ...）</span><br><span class="line">        ↓</span><br><span class="line">Agent 调度层</span><br><span class="line">        ↓</span><br><span class="line">企业数据（Graph）</span><br><span class="line">        ↓</span><br><span class="line">应用（Office / Teams）</span><br></pre></td></tr></table></figure><hr><h2 id="四、最狠的一句话"><a href="#四、最狠的一句话" class="headerlink" title="四、最狠的一句话"></a>四、最狠的一句话</h2><blockquote><p><strong>“未来公司不是由人组成，而是由模型驱动。”</strong></p></blockquote><hr><h2 id="五、对项目管理和-AI-结合的启发"><a href="#五、对项目管理和-AI-结合的启发" class="headerlink" title="五、对项目管理和 AI 结合的启发"></a>五、对项目管理和 AI 结合的启发</h2><p>这篇访谈对关注 AI + 管理的读者是直接命中，可以立刻做三件事：</p><h3 id="1-从”项目管理”到”Agent-编排”"><a href="#1-从”项目管理”到”Agent-编排”" class="headerlink" title="1. 从”项目管理”到”Agent 编排”"></a>1. 从”项目管理”到”Agent 编排”</h3><p>不再盯人，开始设计：</p><ul><li>agent 流程</li><li>数据流</li><li>自动决策链</li></ul><h3 id="2-把”经验”变成”系统”"><a href="#2-把”经验”变成”系统”" class="headerlink" title="2. 把”经验”变成”系统”"></a>2. 把”经验”变成”系统”</h3><p>项目风险判断、需求拆解逻辑——全部可以变成：</p><ul><li>prompt 模板</li><li>agent 流程</li><li>知识库</li></ul><h3 id="3-核心能力要变"><a href="#3-核心能力要变" class="headerlink" title="3. 核心能力要变"></a>3. 核心能力要变</h3><p>未来 PM 不再是”跟进进度”，而是<strong>设计决策系统</strong>。</p><hr><h2 id="最后一句"><a href="#最后一句" class="headerlink" title="最后一句"></a>最后一句</h2><blockquote><p>Satya Nadella 这篇访谈的本质不是讲 AI：<strong>他在重新定义”公司是什么”</strong></p></blockquote><hr><p><strong>原文地址：</strong></p><ul><li><a href="https://www.youtube.com/watch?v=L2OPYYthw4c">Satya Nadella describes how lessons from Microsoft’s history apply to today’s boom - YouTube</a></li><li><a href="https://cheekypint.substack.com/p/satya-nadella-describes-how-lessons">Cheeky Pint - Satya Nadella 访谈全文</a></li></ul>]]>
    </content>
    <id>https://iyangjialin.github.io/2026/04/11/2026-04-11-satya-nadella-redefining-company/</id>
    <link href="https://iyangjialin.github.io/2026/04/11/2026-04-11-satya-nadella-redefining-company/"/>
    <published>2026-04-11T03:40:00.000Z</published>
    <summary>
      <![CDATA[<blockquote>
<p>这篇来自 Cheeky Pint 的访谈，本质上是一次非常”纳德拉式”的认知输出——不是讲 AI 技术，而是在讲**公司如何在 AI 时代重新定义”存在方式”**。</p>
</blockquote>
<p>本文分三层拆解：<strong>他说了什么 → 真正隐含的逻辑 → 我的判断</strong>。</p>]]>
    </summary>
    <title>Satya Nadella 在重新定义公司是什么</title>
    <updated>2026-04-11T03:50:25.185Z</updated>
  </entry>
</feed>
