Agent Skills 深度解析:AI 编码代理的工程化生产级工作流引擎

在当前人工智能辅助编程快速发展的背景下,AI 编码代理(AI Coding Agents)虽然显著提升了代码生成的效率,但普遍存在“短视化开发”的结构性缺陷。具体表现为跳过严谨的需求定义、省略自动化测试环节、忽视安全审查机制,导致产出的代码往往仅停留在原型级别,难以直接投入高可用的生产环境。针对这一痛点,Agent Skills 应运而生。这是一套由资深工程师主导设计的工程化技能体系,旨在将传统软件研发中的质量门禁、最佳实践与决策逻辑编码为结构化的工作流。通过强制 AI 代理遵循生产级标准,该框架从根本上解决了 AI 生成代码“能用但不稳定、好写难维护”的核心难题,实现了从“辅助编写”到“工程化交付”的范式转变。

本文将深入剖析 Agent Skills 的核心架构与设计哲学,详细解读其基于六阶段研发生命周期的工作流设计,并系统阐述包含20项核心技能的完整体系。文章将从定义、规划、构建、验证、审查到交付的全链路视角,结合具体的工程实践场景,展示如何通过标准化约束提升 AI 代码的可靠性与可维护性,为开发者提供一套可落地的生产级 AI 编码工程指南。

一、核心定位与设计哲学:重塑AI编码的工程标准

1.1 核心定位:从文本生成到工程约束

Agent Skills 的本质并非简单的提示词集合或参考文档,而是一个AI 编码代理的生产级工程约束框架。在传统模式下,AI 模型通常基于概率预测生成代码,缺乏对软件工程整体上下文的深刻理解。Agent Skills 通过引入标准化的工作流、严格的质量门禁以及“反合理化”机制,强行介入 AI 的决策过程。其目标是让 AI 代理能够复刻资深软件工程师的研发思维,不仅关注代码语法的正确性,更关注架构的合理性、测试的覆盖率以及部署的安全性,从而输出符合工业级标准的可直接上线代码。

1.2 五大核心设计哲学

为了实现上述目标,Agent Skills 确立了五项核心设计哲学,这些原则构成了整个体系的基石:

  1. 流程优先于文本:在 Agent Skills 体系中,“技能”被定义为可执行的工作流,而非静态的知识库。每个技能都包含明确的执行步骤、关键检查点(Checkpoint)以及严格的退出条件。这种设计确保了 AI 在执行任务时不会偏离既定轨道,而是按照预设的工程逻辑逐步推进。
  2. 反合理化约束机制:AI 模型倾向于选择计算成本最低或路径最短解决方案,这往往导致其跳过测试或简化安全校验。Agent Skills 内置了“借口-反驳”机制,当 AI 试图省略关键步骤时,系统会识别这种“投机行为”并强制要求其提供正当理由或直接阻止,从而杜绝偷懒现象。
  3. 验证不可妥协原则:所有技能的执行结果必须以可量化的证据作为验收标准。例如,不能仅凭 AI 声称“代码已测试”,而必须提供单元测试通过的日志或浏览器自动化测试截图。这种机制拒绝“看起来正确”的模糊结论,确保每一行代码都经过实证检验。
  4. 渐进式信息披露策略:为了优化 Token 消耗并提高执行效率,Agent Skills 采用按需加载参考文档的策略。只有在特定技能执行阶段需要时,才会注入相关的上下文信息。这种最小化上下文窗口的方法,既保证了 AI 的专注度,又降低了运行成本。
  5. 谷歌工程文化落地:该体系深度融合了《Software Engineering at Google》中的经典工程实践,包括 Hyrum 定律(隐式接口依赖)、测试金字塔模型以及主干开发模式。这使得 Agent Skills 不仅仅是一个工具,更是现代软件工程最佳实践的载体。

二、整体架构与生命周期工作流:闭环工程体系

Agent Skills 以六阶段研发生命周期为核心骨架,构建了一个包含7个快捷命令、20项核心技能、3个专家角色与4套核查清单的闭环工程体系。这种分层架构确保了从需求萌芽到最终交付的每一个环节都有章可循。

2.1 六阶段研发生命周期详解

整个研发过程被划分为六个紧密相连的阶段,每个阶段对应特定的工程目标和产出物:

  • DEFINE(定义):这是研发的起点,重点在于将模糊的想法提炼为清晰的概念,并转化为详细的需求规格说明书(Spec)。此阶段强调“先规格后编码”,避免盲目动手。
  • PLAN(规划):基于确定的规格,进行任务拆解。核心原则是“原子化小任务”,将复杂功能分解为可独立开发、测试的小单元,降低认知负荷。
  • BUILD(构建):进入实际编码阶段,遵循“一次一个切片”的原则,采用增量实现和测试驱动开发(TDD)模式,确保代码逐步迭代且始终处于可运行状态。
  • VERIFY(验证):代码编写完成后,立即进入验证环节。包括单元测试编写、调试修复以及浏览器端的功能验证,确保代码逻辑的正确性。
  • REVIEW(审查):在合并代码前,进行严格的代码审查。重点关注代码健康度、安全性加固以及性能优化,模拟资深工程师的代码评审视角。
  • SHIP(交付):最后阶段涉及发布上线、CI/CD 自动化流程配置、灰度发布策略以及文档归档,确保软件顺利交付至生产环境。

2.2 七层命令映射体系

为了降低用户的使用门槛,Agent Skills 设计了7个 Slash 命令,直接映射到上述生命周期的各个阶段。用户只需输入命令,系统即可自动激活对应的技能组合,无需手动配置复杂的上下文。

研发阶段命令核心原则激活技能示例
定义/spec先规格后编码想法提炼、规格驱动开发
规划/plan原子化小任务规划与任务拆解、依赖分析
构建/build一次一个切片增量实现、TDD 实践
验证/test测试即证明测试驱动、调试修复、边界检查
审查/review代码健康优先代码审查、安全漏洞扫描
简化/code-simplify清晰胜于巧妙代码重构、复杂度降低
交付/ship更快即更安全发布检查、CI/CD 配置、文档生成

这种命令映射体系不仅简化了交互流程,更重要的是它隐含了工程规范的强制性。例如,执行 /build 时,系统会自动关联 TDD 相关技能,提醒先生成测试用例再编写业务逻辑。

2.3 完整体系架构解析

Agent Skills 的整体架构分为五层,各层职责明确,协同工作以保障 AI 编码的规范性:

  • 入口层:由7个 Slash 命令组成,是用户与系统交互的核心界面。它负责接收用户指令,并解析出当前所处的研发阶段,进而触发后续流程。
  • 技能核心层:这是体系的大脑,包含20项核心技能。这些技能按照“定义-规划-构建-验证-审查-交付”进行分类管理。核心层还集成了“反合理化机制”和“验证门禁”,实时监控 AI 的执行行为,防止步骤遗漏或简化。
  • 角色层:预配置了3个专家角色(如安全专家、测试专家、架构师)。在审查或特定复杂任务阶段,系统可按需调用这些角色,为代码质量、测试覆盖率和安全防护提供专项支撑,复刻多角色协作的团队开发模式。
  • 参考层:包含4套快捷核查清单(Checklists),涵盖测试、安全、性能等领域。在技能执行过程中,这些清单作为动态参考标准被加载,为 AI 提供具体的判断依据,避免其因缺乏上下文而产生主观偏差。
  • 适配层:负责与主流 AI 编码工具(如 Cursor、VS Code Copilot 等)进行集成。通过插件、规则文件或原生安装等方式,Agent Skills 能够灵活落地于各类开发环境中,极大地降低了推广和使用门槛。

三、20 项核心技能全解析:标准化执行流程

Agent Skills 将六阶段生命周期细化为20项核心技能,每项技能均遵循统一的结构化模板,包含概述、使用场景、执行流程、反合理化机制、红色警报(Red Flags)六大要素。这种标准化设计确保了技能的可复用性和一致性。

3.1 Define 定义阶段:把模糊想法变成可执行规格

定义阶段是整个研发流程的基础,其核心目标是消除需求歧义,确保后续开发的准确性。

idea-refine(想法提炼)

概述: idea-refine 技能旨在通过发散与收敛的思维模型,帮助用户将模糊、抽象初始想法转化为具体、可行的技术方案。在许多实际场景中,用户的需求往往是不完整的或充满假设的,直接编码极易导致方向性错误。该技能通过引导式提问和逻辑推演,澄清核心价值主张和技术可行性。

使用场景

  • 项目初期,只有一个粗略的功能构想(如“做一个类似 Notion 的笔记应用”)。
  • 面对复杂业务逻辑,需要梳理核心实体关系和数据流向。
  • 技术选型犹豫不决,需要对比不同技术栈的优劣。

执行流程

  1. 发散探索:AI 代理首先引导用户描述想法的核心痛点、目标用户及预期功能列表,不限制思维广度。
  2. 收敛聚焦:基于收集的信息,AI 识别出关键功能模块,剔除非核心需求,形成最小可行产品(MVP)范围。
  3. 技术映射:将功能需求映射到具体的技术组件,如数据库类型、前端框架、API 设计风格等。
  4. 方案确认:生成一份简要的技术方案摘要,供用户确认是否准确反映了初衷。

反合理化机制: 如果 AI 试图直接生成代码而跳过需求澄清步骤,系统会触发拦截,提示:“在未明确需求规格前,禁止生成实现代码。请先完成想法提炼。”

红色警报

  • 需求描述中存在大量模糊词汇(如“大概”、“可能”、“最好有”)。
  • 未定义清楚数据所有权和隐私合规要求。
  • 技术选型与现有基础设施严重冲突。

验证标准

  • 输出一份结构清晰的《想法提炼文档》,包含核心功能列表、用户故事地图初步草稿。
  • 用户明确确认技术方案的关键假设无误。

spec-driver(规格驱动开发)

概述: spec-driver 技能强调“规格先行”,要求在编写任何业务逻辑代码之前,必须先制定详细的技术规格说明书。这不仅包括功能描述,还涵盖接口定义、数据模型、错误处理策略等非功能性需求。

使用场景

  • 开发新的 API 接口或微服务模块。
  • 重构遗留系统,需要明确新旧系统的交互契约。
  • 团队协作中,需要作为前后端开发的共同依据。

执行流程

  1. 接口定义:使用 OpenAPI/Swagger 标准定义 RESTful 或 GraphQL 接口,明确请求参数、响应结构及状态码。
  2. 数据建模:设计数据库 Schema 或 TypeScript 接口类型,确立数据流转的标准格式。
  3. 异常处理规范:定义统一的错误码体系和异常捕获机制,确保系统在异常情况下的可控性。
  4. 规格评审:生成完整的规格文档,并进行自我一致性检查,确保无逻辑矛盾。

反合理化机制: 若检测到代码文件中出现了未在规格文档中定义的接口或数据结构,AI 将被要求暂停编码,先补充完善规格文档。

红色警报

  • 接口定义缺少必要的字段验证规则。
  • 数据模型未考虑索引优化或并发控制。
  • 规格文档与实际代码实现出现版本不一致。

验证标准

  • 存在一份版本控制的规格文档(如 specs/api-design.md)。
  • 代码中的接口实现严格遵循规格文档定义,类型检查无报错。
  • 通过自动化脚本验证接口文档与代码注解的一致性。

通过这两个核心技能,Define 阶段有效地将不确定性降至最低,为后续的规划和构建奠定了坚实基础。这种严谨的前期投入,虽然在初期看似增加了时间成本,但在长期维护和问题排查中却能显著降低整体工程风险。

3.2 Plan 规划阶段:拆解为可落地原子任务

规格驱动开发(Spec-Driven Development)确立边界后,核心挑战在于如何将宏大的需求转化为 AI 可精准执行的指令。规划与任务拆解不仅是简单的步骤罗列,更是对系统复杂度的降维处理。通过将大目标拆分为小粒度、独立且可验证的原子任务,我们能够显著降低单次上下文窗口的压力,并明确任务间的依赖拓扑。这种细粒度的拆解策略有效规避了“大爆炸式”变更带来的不可控风险,确保每个子任务都有清晰的验收标准(Acceptance Criteria)。在实际操作中,建议采用依赖图(Dependency Graph)来可视化任务顺序,优先处理核心路径上的阻塞点。此外,每个原子任务应包含明确的输入输出定义,以便后续环节进行自动化校验。这种结构化的规划方式,使得 AI 代理能够像资深工程师一样,按部就班地推进复杂系统的构建,而非盲目生成代码。

3.3 Build 构建阶段:增量式高质量编码

增量实现与测试驱动

增量实现强调垂直切片开发模式,即每次仅完成一个完整的功能闭环,从数据库到前端界面全部打通。这种模式要求建立“提交 - 测试 - 验证”的快速反馈闭环,确保每一步变更都是可控且可逆的。结合测试驱动开发(TDD),遵循“红 - 绿 - 重构”的标准流程,强制要求在编写业务逻辑前先定义测试用例。在测试金字塔结构中,应保持单元测试占 80%、集成测试占 15%、端到端测试占 50% 的比例,以确保测试效率与维护成本的平衡。值得注意的是,在测试代码中,DAMP(Descriptive And Meaningful Phrases,描述性且有意义的短语)原则优于传统的 DRY 原则,因为测试代码的可读性远比复用性重要。通过特性开关(Feature Flags)和安全默认值机制,可以在不破坏主干稳定性的前提下并行开发多个功能模块。

API 设计与上下文工程

API 与接口设计环节,必须坚持契约优先(Contract-First)原则,严格遵循 Hyrum 定律,即接口的所有可观察行为都构成契约的一部分。这意味着不仅要定义正确的成功响应,更要完善错误语义、状态码映射及边界条件的校验逻辑,避免隐式依赖导致的版本兼容性问题。与此同时,上下文工程成为提升 AI 编码质量的关键杠杆。由于 LLM 存在注意力分散问题,需精准投喂与当前任务最相关的代码片段、文档摘要及类型定义,而非全量代码库。通过动态裁剪上下文窗口,去除噪声数据,可以显著减少 AI 的幻觉产生率,确保生成的代码符合项目现有的架构风格。这种精细化的上下文管理,是解决长周期开发中 AI 输出质量随时间衰减问题的核心手段。

源码驱动与前端工程

源码驱动开发要求 AI 在决策时严格基于官方文档和权威源码,并在生成代码中标注引用来源,从而保证技术选型的准确性与权威性。在前端领域,前端 UI 工程不仅关注视觉还原,更强调组件架构的复用性与设计系统的一致性。状态管理应采用单向数据流原则,确保数据变化的可追踪性;同时,必须严格遵守 WCAG 2.1 AA 无障碍标准,确保应用对各类用户群体的友好性。响应式设计需覆盖主流断点,并通过自动化视觉回归测试防止样式退化。通过将设计规范编码化为 lint 规则或组件约束,AI 能够在生成 UI 代码时自动遵循最佳实践,减少人工调整样式的繁琐工作,提升前端交付的一致性与专业度。

3.4 Verify 验证阶段:用证据证明代码可用

浏览器测试与实时校验

代码生成的结束并非开发的终点,浏览器测试是验证前端逻辑正确性的最后一道防线。利用 Chrome DevTools 等工具,可以对 DOM 结构、控制台日志、网络请求及性能指标进行实时校验。这一过程不仅仅是肉眼观察,更应通过自动化脚本捕获关键事件流,确保用户交互符合预期。例如,检查异步数据加载时的骨架屏显示、错误状态下的降级处理以及内存泄漏迹象。通过将这些校验步骤标准化,AI 代理可以自我诊断渲染问题,如布局偏移(CLS)或交互延迟(INP),并在提交前自动修复常见的 DOM 操作错误。这种基于真实运行环境的验证机制,弥补了静态代码分析在动态行为检测上的不足,确保交付物在浏览器中的表现符合生产级要求。

调试流程与错误恢复

当验证失败时,调试与错误恢复机制立即启动,遵循“复现 - 定位 - 简化 - 修复 - 防护”的五步标准化流程。首先,必须能够稳定复现问题,排除环境偶发因素;其次,通过二分法或日志追踪精准定位故障根因;接着,最小化复现案例以隔离干扰变量;随后实施修复并补充回归测试;最后,添加防御性代码防止同类问题再次发生。在此过程中,强制止损机制至关重要,若连续多次修复尝试无效,系统应暂停执行并请求人工介入,避免陷入无限循环的错误修正陷阱。这种结构化的调试思维,使得 AI 能够像经验丰富的开发者一样,冷静分析问题脉络,而非盲目试错,从而大幅提升问题解决的效率与准确性。

3.5 Review 审查阶段:上线前质量门禁

代码审查与简化策略

代码审查是保障代码质量的终极关卡,需执行五维度审查:逻辑正确性、可读性、安全性、性能及可维护性。为提升审查效率,建议将单次变更控制在 100 行以内,并实行分级反馈机制,区分阻断性问题与建议性优化。在审查过程中,代码简化原则贯穿始终,遵循切斯特顿栅栏原理,即在未理解现有代码存在原因前,严禁随意删除或修改。同时,应用“500 行规则”,单个文件或函数的复杂度应保持在合理阈值内,通过提取辅助函数、拆分模块来降低认知负荷。简化的核心目标是在保留原有行为的前提下,最大程度降低代码的认知复杂度,使后续维护者能够快速理解意图。AI 在此阶段可充当初步审查员,自动识别冗余逻辑、命名不规范及潜在的坏味道,减轻人类专家的压力。

安全加固与性能优化

安全加固环节需全面防御 OWASP Top 10 常见漏洞,重点检查注入攻击、跨站脚本(XSS)及不安全的反序列化风险。完善的认证授权机制、密钥管理及依赖包审计是不可或缺的基础设施,任何第三方库引入前必须经过安全评分筛选。在性能优化方面,坚持“先测量后优化”的原则,避免过早优化导致的代码晦涩。对标核心网页指标(Core Web Vitals),深入分析打包体积、树摇(Tree Shaking)效果及运行时性能反模式。通过性能剖析工具识别瓶颈热点,针对性地进行算法优化或缓存策略调整。这一阶段的目标是确保代码不仅在功能上正确,更在安全性和运行效率上达到生产环境的高标准要求,杜绝因疏忽导致的生产事故。

3.6 Ship 交付阶段:安全高效上线生产

Git 工作流与 CI/CD 自动化

Git 工作流采用主干开发模式,强调原子提交,即每次提交仅包含一个逻辑变更,并作为可追溯的历史保存点。这种细粒度的版本控制策略,使得回滚和 cherry-pick 操作变得极其简便,有效控制了变更规模带来的风险。配合CI/CD 自动化流水线,实现测试左移,将单元测试、静态分析及安全扫描前置到提交阶段。通过特性开关和质量门禁,流水线能够快速反馈失败信息,阻止不合格代码合并入主干。自动化部署脚本需具备幂等性,确保多次执行结果一致,并结合基础设施即代码(IaC)理念,实现环境的一致性管理。这种高度自动化的交付体系,大幅缩短了从代码编写到生产部署的周期,提升了研发团队的响应速度与交付信心。

废弃管理与文档沉淀

软件生命周期中,废弃与迁移管理常被忽视,却是控制技术负债的关键。秉持“代码即负债”的理念,需规范废弃流程,明确标记过时 API 的替代方案及移除时间表,定期清理僵尸代码。与此同时,文档与架构决策记录(ADR)的完善同样重要。每次重大技术选型或架构变更,都应记录决策背景、备选方案及最终理由,为后续维护提供历史语境。API 文档需保持与代码同步更新,内联注释应解释“为什么”而非“是什么”。在发布与上线环节,严格执行上线清单,管理特性开关的生命周期,实施灰度发布策略以监控早期异常,并预设一键回滚机制。全方位的监控配置确保上线后能实时感知系统健康状态,形成闭环的生产运维体系。

四、技能标准结构与执行机制

4.1 单技能标准解剖

一个标准化的 Agent Skill 并非简单的文本提示,而是一个结构严谨的执行协议。其核心结构包含以下关键部分:Frontmatter 前置元数据定义技能的版本、作者及依赖关系;Overview 概述简明扼要地说明技能的目标与核心价值;When to Use 使用场景明确界定适用的边界条件,防止误用;Process 执行流程以步骤化形式指导 AI 的具体操作路径;Rationalizations 反合理化表预判并驳斥 AI 可能出现的偷懒借口;Red Flags 红色警报列出必须立即停止执行的危险信号;Verification 验证标准提供客观的验收指标。这种模块化设计使得技能具备高度的可组合性与可维护性,便于在不同项目中复用与迭代。

4.2 关键执行机制

为确保技能被严格执行,系统内置了四项关键机制。首先是反合理化约束,针对 AI 常见的“后续补测试”或“代码简单无需审查”等借口,提供标准化的反驳逻辑,强制其完成完整流程。其次是红色警报机制,一旦检测到如敏感信息泄露、无限递归等异常信号,立即暂停执行并优先修复,防止错误扩散。第三是不可妥协的验证标准,拒绝主观判断,仅以测试通过、构建产物完整及运行时数据符合预期作为验收依据。最后是渐进式加载策略,主技能文件作为入口,其他参考清单按需动态加载,既保证了上下文的完整性,又优化了 Token 使用效率,确保在有限资源下实现最佳执行效果。

五、多平台适配与落地实践

Agent Skills 的设计理念具有高度的平台无关性,能够通过规则文件、插件或指令集等多种方式集成到主流 AI 编码工具中。对于 Claude Code 用户,可通过插件市场直接安装扩展包,实现无缝接入;Cursor 用户只需将标准化的 SKILL.md 文件复制到 .cursor/rules/ 目录下,即可激活相应技能;Gemini CLI 支持原生技能安装,通过命令行即可拉取最新版本的技能库;GitHub Copilot 用户可将技能内容写入 .github/copilot-instructions.md,作为全局角色指令生效;Kiro IDE 及其他通用代理则可通过读取特定目录下的 Markdown 技能文件,将其注入系统提示词中。这种灵活的集成方式,降低了团队引入新工作流的门槛,使得不同技术栈的团队都能快速享受到工程化带来的红利。

5.1 落地最佳实践

在实际落地过程中,建议遵循以下最佳实践以确保效果最大化。首先,严格执行初始化流程,先通过 /spec 命令定义详细规格,再使用 /plan 拆解任务,坚决杜绝未经规划直接编码的行为。其次,实施严格的编码约束,限制单次变更行数在 100 行以内,强制推行 TDD,并在提交前通过安全与性能清单的自动化校验。再者,建立规范的审查机制,启用专门的代码审查专家角色,执行五维度审查,只有获得通过标识后方可执行 /ship 命令。最后,加强上线管控,所有新功能必须配备特性开关,采用灰度发布策略,并预先准备经过验证的回滚方案,确保生产环境的绝对安全与稳定。

六、工程价值与行业意义

6.1 解决 AI 编码核心痛点

Agent Skills 的引入直击当前 AI 辅助编程的核心痛点。它彻底告别了仅供演示的原型代码,通过强制性的生产级流程,确保输出的每一行代码都具备工业级的健壮性与可维护性。内置的代码简化、文档生成及废弃管理机制,显著降低了长期维护成本,有效遏制了技术负债的无序增长。通过左移安全审查,将防御常见漏洞的动作前置到编码阶段,大幅提升了系统的安全性,减少了生产环境中的安全事故。此外,坚持“先测量后优化”的性能治理原则,避免了因盲目优化导致的性能退化,保证了最终交付物的质量,使 AI 生成的代码真正经得起生产环境的考验。

6.2 行业价值

从行业视角来看,Agent Skills 首次将资深工程师的工程判断力进行了模型化与标准化封装。这一突破使得 AI 编码角色从单纯的“辅助工具”升级为具备独立交付能力的“生产级开发主体”。它不仅为企业构建高效的 AI 研发流水线奠定了坚实基础,更推动了整个软件开发行业向工程化、标准化时代迈进。通过统一的质量门禁与工作流规范,团队能够消除个体能力差异带来的波动,实现规模化的高质量代码产出。这种范式转移,预示着未来软件工程将进入人机协作的新阶段,其中 AI 承担标准化执行,人类专注于架构决策与创新,共同重塑软件生产的价值链。

七、总结与展望

Agent Skills 绝非简单的提示词优化技巧,而是一套完整的AI 编码工程化操作系统。它通过结构化的工作流设计、刚性的质量门禁以及谷歌级别的工程实践,彻底重塑了 AI 参与软件生产的模式。它将模糊的自然语言指令转化为精确的工程动作,确保了开发过程的可控性与结果的一致性。展望未来,随着技能体系的不断迭代与丰富,其覆盖范围将进一步扩展至云原生架构、低代码平台及多语言生态等领域。Agent Skills 有望成为 AI 编码代理的通用工程标准,赋予 AI 真正的资深工程师研发能力与质量意识,让智能编码从实验走向常态,从辅助走向主导,最终实现软件生产力质的飞跃。

附录:项目目录结构


agent-skills/
├── skills/            # 20 项核心技能,涵盖规划、编码、测试等全流程
├── agents/            # 3 个专家角色定义,包括架构师、审查员等
├── references/        # 4 套核查清单,用于安全、性能等专项校验
├── hooks/             # 生命周期钩子,用于触发自动化检查
├── .claude/commands/  # 7 个快捷命令,简化日常交互操作
└── docs/              # 各工具部署指南及详细使用说明