AI 编程工具的四层能力体系：Skills、MCP、Rules、Agents 完全指南

张开发

• 2026/4/20 9:10:56 • 15 分钟阅读

分享文章

AI 编程工具的四层能力体系：Skills、MCP、Rules、Agents 完全指南

2024 年底Anthropic 发布了 Model Context ProtocolMCP2025 年底Agent Skills 作为开放标准正式推出到 2026 年初Claude Code 已跃居开发者最喜爱的 AI 编程工具榜首。在这场变革背后有四个核心概念正在重塑我们与 AI 协作编程的方式Skills技能、MCP模型上下文协议、Rules规则和Agents智能体。它们各自解决什么问题彼此之间是什么关系为什么说理解它们就是理解 AI 编程的未来在深入技术细节之前我们先用一个直观的类比来建立整体认知概念医院类比核心作用Rules医院管理制度始终生效的行为规范Skills医疗操作手册按需查阅的专业知识MCP检验设备与病历系统连接外部工具和数据Agents各科室的医生独立执行复杂任务医院的管理制度Rules规定了所有人都必须遵守的基本规范——手术前必须洗手、处方必须双人核对。医疗操作手册Skills则是各种专业操作的详细指南——心脏搭桥手术怎么做、急救流程是什么。检验设备和病历系统MCP让医生能够获取化验结果、调阅影像资料、查看患者历史。而各科室的医生Agents则是独立思考、自主行动的专业人员他们遵循制度、参考手册、使用设备最终完成诊疗任务。理解了这个类比我们就可以逐一展开了。Rules始终在线的行为规范什么是 RulesRules 是 AI 编程助手启动时就加载的持久化指令定义了 AI 在整个工作过程中必须遵循的约束和规范。在 Claude Code 中Rules 主要通过CLAUDE.md文件和.claude/rules/目录来定义。它解决什么问题每次你开启一个新的 AI 对话AI 对你的项目一无所知——它不知道你用的是什么构建工具、测试框架是哪个、代码风格有什么偏好、提交信息该怎么写。如果每次都要重新交代这些效率极低。Rules 就是解决这个问题的一次定义每次对话自动生效。实际例子# CLAUDE.md — 项目根目录## 构建命令- 运行测试npm test- 构建项目npm run build## 代码规范- 使用 TypeScript strict 模式- 组件文件使用 PascalCase 命名- commit 信息遵循 Conventional Commits 格式## 架构约定- API 路由放在 src/routes/ 下- 数据库操作必须通过 Repository 层作用范围层叠式继承Rules 支持多层级继承从最宽泛到最具体全局规则 ~/.claude/CLAUDE.md → 所有项目生效项目规则 ./CLAUDE.md → 当前项目生效目录规则 ./src/api/CLAUDE.md → 特定目录生效条件规则 .claude/rules/python.md → 仅处理 .py 文件时生效层级越深优先级越高。你可以在全局设置通用偏好在项目中覆盖特定配置在子目录中进一步细化——就像 CSS 的层叠规则一样。跨工具支持Rules 并非 Claude Code 独有。几乎所有主流 AI 编程工具都有类似机制工具Rules 实现Claude CodeCLAUDE.md.claude/rules/Cursor.cursor/rules/*.mdcGitHub Copilot.github/copilot-instructions.mdWindsurf.windsurf/rules/KiroSteering 文件2025 年一个跨平台标准AGENTS.md应运而生由 Google、OpenAI、Sourcegraph 等联合推出目前已被6 万多个 GitHub 仓库采用旨在让一份指令文件适配所有 AI 编程工具。Skills按需加载的专业技能什么是 Skills如果说 Rules 是「公司制度手册」那 Skills 就是「岗位操作手册」。Skills 是模块化的指令包每个 Skill 是一个文件夹核心是一个SKILL.md文件里面包含了完成特定任务的详细步骤、工作流程和参考资料。它由 Anthropic 在 2025 年 10 月首次推出12 月作为开放标准 Agent Skills 发布现已被 Claude Code、Cursor、VS Code Copilot、OpenAI Codex 等20 多个平台支持。它解决什么问题Rules 适合放简短的约束和规范但当你需要教 AI 完成一个复杂的、多步骤的工作流程时Rules 就力不从心了。比如• 如何将 Markdown 文章转换为微信公众号格式并发布• 如何按照团队规范进行代码审查• 如何生成符合品牌设计风格的封面图这些都需要详细的步骤说明、决策逻辑、甚至配套脚本——这正是 Skills 的用武之地。关键特性渐进式加载Skills 最精妙的设计在于渐进式加载Progressive Disclosure空闲时仅加载名称和描述 → ~30-50 tokens激活时加载完整指令 → 数千 tokens这意味着你可以安装几十个 Skill但只在需要时才消耗上下文窗口。相比把所有指令塞进 Rules每次对话都全量加载Skills 节省了 90% 以上的 token 开销。一个 Skill 长什么样---name: code-reviewdescription: 对代码变更进行全面审查检查安全性、性能和可维护性version: 1.0.0user-invokable: true---## 审查流程1. **读取变更**获取所有修改的文件2. **分层检查** - 安全性是否存在注入、XSS、敏感信息泄露 - 正确性逻辑是否正确边界条件是否处理 - 性能是否有 N1 查询、不必要的重渲染 - 可维护性命名是否清晰是否过度设计3. **输出报告**按严重程度分级Critical / High / Medium / Low用户可以通过/code-review斜杠命令手动调用AI 也会在检测到相关任务时自动激活。Skills 生态Skills 已经形成了一个类似 npm 的生态系统•公共目录skills.sh 提供可搜索的 Skill 索引•安装工具npx skills add owner/reposkill一键安装•版本锁定skills-lock.json确保团队使用一致的版本•用户定制通过EXTEND.md文件覆盖默认配置MCP连接万物的通用协议什么是 MCPModel Context Protocol模型上下文协议是 Anthropic 在 2024 年 11 月发布的开放标准用于将 AI 助手与外部工具和数据源连接起来。一句话概括MCP 是 AI 的 USB-C 接口。在 MCP 出现之前让 AI 连接 GitHub 需要一套代码连接数据库需要另一套连接 Slack 又是一套——每个集成都是定制开发。MCP 将这一切标准化为一个协议任何 MCP 兼容的客户端都能连接任何 MCP 兼容的服务器无需定制胶水代码。技术架构MCP 采用客户端 - 服务器架构通过三个核心原语工作┌─────────────────────────────┐│ AI 助手Host ││ ││ ┌───────────┐ ││ │ MCP Client │──────────── │──→ MCP Server: GitHub│ └───────────┘ ││ ┌───────────┐ ││ │ MCP Client │──────────── │──→ MCP Server: 数据库│ └───────────┘ ││ ┌───────────┐ ││ │ MCP Client │──────────── │──→ MCP Server: Notion│ └───────────┘ │└─────────────────────────────┘三个核心原语原语作用类比ToolsAI 可以调用的函数动词——「做什么」ResourcesAI 可以读取的数据名词——「看什么」Prompts预定义的交互模板模板——「怎么问」生态现状截至 2026 年初MCP 生态已经相当成熟•97M月度 SDK 下载量•10,000社区构建的 MCP 服务器• 所有主流 AI 工具Claude、ChatGPT、Gemini、Copilot、Cursor均已原生支持• 已捐赠给Linux 基金会由 Anthropic、OpenAI、Google、Microsoft、AWS 共同治理常见的 MCP 服务器包括服务器功能GitHub MCP操作 PR、Issue、仓库Playwright MCP浏览器自动化Supabase MCP数据库操作Notion MCP知识库管理Context7 MCP实时查询库文档Filesystem MCP文件系统读写MCP vs API 调用三个关键区别你可能会问这和直接调 API 有什么区别标准化开发者只需实现一次 MCP 协议所有 AI 工具都能用而不是为每个 AI 工具分别对接双向通信MCP 不仅仅是 AI 调用工具工具也可以主动向 AI 推送信息如数据变更通知安全模型MCP 内置了权限控制用户可以精细地控制 AI 能访问什么、能做什么Agents自主行动的智能体什么是 Agents如果把前面三个概念比作基础设施那 Agents 就是真正「干活的人」。Agent 是一个能够自主规划、执行、检查和调整的 AI 实例。它不只是回答问题——它会制定计划、拆分任务、调用工具、检查结果如果发现问题还会自行修正直到任务完成。子智能体Subagents在 Claude Code 中主对话可以派生出专门的子智能体来并行处理任务主对话你在交互的 AI ├── 子智能体 A安全审查独立上下文 ├── 子智能体 B性能分析独立上下文 └── 子智能体 C代码风格检查独立上下文每个子智能体• 拥有独立的上下文窗口不会污染主对话• 可以配置专属的工具集和MCP 服务器• 可以预加载特定 Skills• 完成后只返回结果摘要给主对话这就像医院里的分诊制度主治医师负责统筹具体的化验、影像、检查分别交给各科室专家去做最终汇总结果再做诊断。自定义 Agent你可以创建自己的专属 Agent---name: security-reviewerdescription: 审查代码中的安全漏洞tools: Read, Grep, Glob, Bashmodel: opus---你是一名资深安全工程师。请审查代码中的以下问题- 注入漏洞SQL、XSS、命令注入- 认证和授权缺陷- 代码中的密钥或凭据- 不安全的数据处理请提供具体的代码行引用和修复建议。将这个文件放在.claude/agents/目录下AI 就能在适当时机自动调用它。Agent Teams智能体团队更进一步Claude Code 还支持多个独立的 AI 会话协同工作Team Lead团队负责人 ├── 成员 A负责前端重构 ├── 成员 B负责 API 开发 └── 成员 C负责测试编写团队成员通过共享任务列表和消息传递来协调工作就像一个真正的开发团队一样。四者如何协同工作理解了每个概念之后让我们看看它们是如何在一个真实场景中协同运作的。场景你对 AI 说「帮我实现用户注册功能包含邮箱验证」1. Rules 生效 → AI 读取 CLAUDE.md知道项目用 Next.js Prisma → AI 读取代码规范知道要用 TypeScript strict 模式 → AI 读取提交规范知道 commit 格式要求2. Skills 激活 → AI 自动加载 TDD Skill决定先写测试 → AI 加载 Code Review Skill准备写完后自审3. MCP 连接 → 通过 GitHub MCP 创建功能分支 → 通过数据库 MCP 检查现有 Schema → 通过 Playwright MCP 运行端到端测试4. Agents 分工 → 主 Agent 制定实施计划 → 子 Agent A编写数据库迁移脚本 → 子 Agent B实现 API 路由 → 子 Agent C编写前端表单组件 → 子 Agent D安全审查所有代码 → 结果汇总主 Agent 提交代码四者各司其职缺一不可。分层架构全景图┌─────────────────────────────────────────────────┐│ 用户交互层 ││ 你输入指令AI 回复结果 │├─────────────────────────────────────────────────┤│ Agents执行层 ││ 自主规划、并行执行、检查结果、自动修正 │├─────────────────────────────────────────────────┤│ Skills知识层 ││ 按需加载的专业知识、工作流程、操作指南 │├─────────────────────────────────────────────────┤│ Rules约束层 ││ 始终生效的代码规范、项目配置、团队约定 │├─────────────────────────────────────────────────┤│ MCP连接层 ││ 标准化的外部工具和数据源接口 │├─────────────────────────────────────────────────┤│ Hooks自动化层 ││ 确定性的生命周期脚本不依赖 AI 推理 │└─────────────────────────────────────────────────┘你可能注意到了图中还有一个Hooks——它是在 AI 推理循环之外运行的确定性脚本比如每次提交前自动运行 lint、每次启动时检查环境变量。Hooks 是「自动安检员」不需要 AI 理解或判断只要触发条件满足就执行。横向对比各工具的支持情况能力Claude CodeCursorGitHub CopilotWindsurfKiroRulesCLAUDE.md rules/.cursor/rules/*.mdccopilot-instructions.md.windsurf/rules/Steering 文件Skills原生支持支持 Agent Skills支持 Agent Skills待支持支持 Agent SkillsMCP原生首发已支持已支持已支持通过 Bedrock 支持Agents子智能体团队Agent ModeAgent ModeCascade自主 AgentHooks生命周期钩子Beta有限支持暂无Agent Hooks跨平台标准AGENTS.mdAGENTS.mdAGENTS.mdAGENTS.mdAGENTS.md可以看到MCP和AGENTS.md已成为事实上的行业标准所有主流工具都在向它们靠拢。趋势与展望标准化融合MCP、Agent Skills、AGENTS.md 都已进入 Linux 基金会旗下碎片化的时代正在过去。从助手到自主工程师AI 编程工具的演进路径清晰可见——从 2022 年的行内补全Copilot到 2025 年的智能体会话Claude Code再到 2026 年的多日自主编程Kiro。Skills 生态爆发就像 npm 之于前端、Docker 之于容器化Skills 正在成为AI 能力分发的标准单元。Token 效率成为核心关注渐进式加载Skills、服务端数据过滤MCP、上下文隔离Subagents——整个行业都在想方设法让有限的上下文窗口发挥最大价值。写在最后Skills、MCP、Rules、Agents——这四个概念并不是相互竞争的替代品而是一个精心设计的分层系统中各司其职的组件•Rules告诉 AI「你必须遵守什么」•Skills告诉 AI「你应该怎么做」•MCP让 AI「能够触及什么」•Agents让 AI「自主完成什么」理解这四个概念不仅能帮助你更高效地使用当前的 AI 编程工具更能让你看清这个领域的发展方向——从编写代码的助手到管理代码的工程师AI 正在一步步走来。而你要做的不是担心被替代而是学会如何当好这支 AI 团队的「技术总监」。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多文章

前端开发 2026/4/20 9:10:01

Legacy-iOS-Kit终极指南：让旧款iOS设备重获新生的完整教程

Legacy-iOS-Kit终极指南：让旧款iOS设备重获新生的完整教程【免费下载链接】Legacy-iOS-Kit An all-in-one tool to restore/downgrade, save SHSH blobs, jailbreak legacy iOS devices, and more 项目地址: https://gitcode.com/gh_mirrors/le/Legacy-iOS-Kit …

【导语：Nanopass 框架作为一种用于创建编译器的嵌入式领域特定语言，专注于小型编译阶段和多种中间表示，能减少样板代码，让编译器更易理解和维护。】专注小型编译阶段的 Nanopass 框架Nanopass 框架是一种嵌入式领域特定语言&#…

张开发

前端开发 2026/4/20 8:44:44

5大核心模块构建的智能游戏自动化系统：BetterGI原神辅助工具终极指南

张开发

AI 编程工具的四层能力体系：Skills、MCP、Rules、Agents 完全指南

最新文章

Windows Server 2019上Oracle 19c安装踩坑实录：从下载WINDOWS.X64_193000_db_home.zip到Navicat连接成功

Python实战：用京东云SDK快速搞定短信验证码发送（附完整代码与避坑点）

LightOnOCR-2-1B惊艳OCR成果：中文繁体+日文平假名+英文混合识别

Kook Zimage 真实幻想 Turbo入门教程：从零开始的Linux环境部署

如何用Video-subtitle-extractor本地提取87种语言视频硬字幕：终极完整指南

Translumo：终极屏幕实时翻译工具完整使用指南

推荐文章

告别UI管理混乱：DoozyUI的UICanvas与UIView如何帮你构建可维护的Unity项目架构

机器人逆解编程避坑：为什么你的关节角度会突然跳变？聊聊atan2的36种‘过零’情况

前端三剑客 vs Vue.js：核心区别解析

AGI不是演化的终点，而是认知范式的断层重启：20年一线实践者亲述——为什么今天部署的每个大模型都在为AGI铺错路

3分钟告别英文界面：FigmaCN让你的设计工作流更流畅

1.3寸OLED 12864 SH1106中文字库屏：从硬件解析到中文显示实战

相关文章

ESP32智能语音助手开发瓶颈突破：基于MCP协议的全栈硬件AI解决方案重构

turboacc：开源工具性能优化的创新方法 - OpenWrt用户指南

LibreCAD：为什么这款免费开源的2D CAD软件能替代昂贵的商业工具？

解锁AI编程新范式：7个颠覆认知的Continue插件实战场景

LA-PEG-SCM，硫辛酸PEG琥珀酰亚胺乙酸酯，一种新型异双功能PEG衍生物

从‘能用’到‘好用’：设计运放电路时，90%的人会忽略的输入/输出阻抗问题（以TI OPA2188为例）

分享文章

更多文章

Legacy-iOS-Kit终极指南：让旧款iOS设备重获新生的完整教程

Kubernetes 常见故障之Pod【20260420】004篇-精华篇

KUKA机器人扩展轴配置避坑指南：从WorkVisual看KPP/KSP选型与RDC数量限制

如何5分钟完成QQ空间数据备份：GetQzonehistory终极指南

3步解锁Zotero自动文献下载：SciPDF插件深度解析与实战指南

3分钟学会AI抠图：用BiRefNet让照片和视频一键变透明背景的终极指南

SMUDebugTool终极指南：免费开源工具一键解锁AMD Ryzen隐藏性能

Wan2.2-I2V图片转视频教程：零代码基础，轻松创作

【AGI空间推理黄金框架】：基于MIT+DeepMind联合验证的4层认知架构，90%研发团队尚未部署

DeepSeek融资传闻背后四重逻辑：期权定价、低估值筛选、股权置换与信号对冲

Nanopass 框架：减少编译器样板代码，提升可维护性

5大核心模块构建的智能游戏自动化系统：BetterGI原神辅助工具终极指南