拆解Superpowers,给Claude Code装上“顶级SOP”,让AI开发告别混乱

张开发
2026/4/8 9:37:11 15 分钟阅读

分享文章

拆解Superpowers,给Claude Code装上“顶级SOP”,让AI开发告别混乱
在AI辅助开发的赛道上很多人都有过这样的崩溃时刻明明只是让Claude Code写一个简单的用户注册功能它却一口气修改了五六个文件运行后满屏报错反馈问题后它又匆匆修改几轮下来项目代码变得杂乱无章不仅没提高效率反而增加了额外的整理成本。这不是Claude Code不够聪明而是我们没有给它立好“规矩”就像一个没有流程约束的团队再厉害的成员也会乱了章法。而Superpowers的出现恰好解决了这个痛点。它不是什么复杂的二进制程序也不是对Claude Code的底层改造本质上就是一套给Claude Code量身定制的“顶级SOP”标准作业程序。这套技能框架的核心作用就是把程序员的工程经验固化成可执行的规则强制约束AI的开发行为让AI从“随心所欲写代码”变成“按部就班做开发”。今天我们就来深度拆解Superpowers看看这组看似简单的Skill文件到底是如何管住AI开发行为让AI辅助开发从“添乱”变成“提效”的。无论是正在用Claude Code做开发的程序员还是对AI工程化落地感兴趣的从业者读懂这篇内容都能学会如何把AI的能力用在刀刃上让技术效率翻倍。一、AI辅助开发的“老顽疾”没规矩必混乱在聊Superpowers之前我们先直面一个现实AI辅助开发虽然已经普及但绝大多数人都在用错方式。很多人把Claude Code当成“自动代码生成器”只丢给它一个模糊的需求就指望它能产出完美的代码却忽略了AI本身的“短板”——没有流程约束的情况下AI很容易陷入“盲目动手、缺乏验证”的误区。总结下来AI辅助开发有两个最让人头疼的老毛病几乎每个用过AI写代码的人都遇到过。第一个毛病上来就动手改代码缺乏需求对齐。很多时候我们给出的需求是模糊的比如“帮我优化一下登录接口”但“优化”的定义是什么是提升响应速度还是增加异常处理或是优化代码可读性这些细节如果不提前说清AI就会按照自己的理解去修改结果往往与我们的预期背道而驰。更麻烦的是AI不会主动追问而是直接上手写代码等我们发现问题时它已经修改了多个文件回滚起来非常麻烦。第二个毛病改完代码拿不出证据无法确认正确性。AI特别擅长“自信表达”修改完代码后总会说“已经改好了可以正常运行”但实际上很多时候代码存在隐藏bug或是不符合项目规范。而我们如果要逐一检查AI修改的内容不仅耗时耗力也失去了用AI辅助开发的意义。更关键的是AI不会主动提供验证证据我们无法判断它的修改是否真的解决了问题只能靠运气去测试一旦出现问题又要重新沟通、重新修改陷入恶性循环。举个最常见的场景你让Claude Code帮你写一个用户注册功能需求里只提了“要支持手机号、验证码注册还要校验密码强度”。没有任何额外说明的情况下Claude Code可能会直接修改你的用户模型文件、路由文件、控制器文件甚至会擅自添加依赖包。等你运行项目时发现它没有做手机号格式校验密码强度校验的规则也不符合你的预期而且还修改了原本正常的登录逻辑导致登录功能报错。这时候你反馈问题它又会重新修改来回几轮整个项目的代码结构变得混乱不堪原本半小时能完成的工作反而花了几个小时还不如自己动手写。其实这些问题的根源不是AI不够智能而是我们没有给AI设定清晰的“工作流程”。就像一个新员工入职如果没有岗前培训没有明确的工作规范再聪明的人也会出错。AI也是一样它需要一套明确的SOP来约束自己的行为知道什么时候该做什么、怎么做、做完后如何验证。而Superpowers就是这套SOP的“载体”。Superpowers的核心逻辑很简单不改变Claude Code的底层能力而是通过一组Skill文件强制介入AI的开发过程把“需求对齐、拆分计划、隔离开发、验证确认”这几个关键环节变成AI必须遵守的规则跳不过去、绕不开从而避免AI盲目动手确保开发过程有序、产出结果可验证。二、核心机制Skill文件AI开发的“行为准则”很多人听到Superpowers会以为它是一个需要安装、配置的复杂工具其实不然。Superpowers本质上是一套Agent技能框架没有复杂的二进制程序核心就是一组Skill文件。这些文件的作用就是给Claude Code定规矩告诉它在开发过程中每一步应该做什么、怎么做。在Claude Code的体系里有一个非常便捷的触发机制只要你在项目的skills/目录下定义了SKILL.md文件Claude Code就会在执行任何开发任务前自动扫描这个文件并严格遵循文件中定义的规则。这个触发策略非常“强硬”——只要有1%的可能性适用这个SkillClaude Code就会强制调用相关规则而不是“建议”或“可选”。这一点非常关键也是Superpowers能“管住”AI的核心原因。很多人之前也尝试过给Claude Code写提示词比如“先理解需求再写代码”“写完代码后做测试”但这些提示词都是“软约束”AI很可能会忽略继续按照自己的方式动手。而Superpowers的Skill文件是“硬约束”只要触发条件满足AI就必须执行没有任何讨价还价的余地。举个例子如果你的项目skills/目录下有一个关于“brainstorming需求对齐”的Skill文件那么无论你给Claude Code的需求多么模糊它都不会直接动手写代码而是先执行brainstorming的相关规则和你对齐需求细节。只有完成了需求对齐它才能进入下一步的任务拆分和代码编写。这里需要强调一点Superpowers的Skill文件本质上就是用自然语言写的“规则文档”不需要你懂复杂的编程语法也不需要你进行复杂的配置。你只需要把自己的开发经验、工作流程整理成清晰的规则写入SKILL.md文件Claude Code就能自动识别并遵循。比如你可以在Skill文件中规定“必须先写测试用例再写业务代码”“每个代码修改都必须提供运行结果截图”这些规则都会被Claude Code严格执行。而且Superpowers的Skill文件是可扩展、可定制的。它本身提供了14个基础Skill覆盖了开发的全流程但你可以根据自己的项目需求、开发习惯修改现有Skill的规则或者新增自定义的Skill。比如你的项目要求所有代码都必须符合ESLint规范你就可以新增一个“eslint-check”的Skill强制AI在提交代码前检查代码是否符合规范不符合就不能提交。简单来说Superpowers的核心机制就是“用自然语言写规则用Skill文件定约束用强硬触发保执行”。它把程序员的隐性经验变成了AI可以理解、可以执行的显性规则让AI按照我们的方式去工作而不是反过来让我们去迁就AI的混乱行为。三、Skill全景图14个Skill四层架构全流程约束Superpowers目前包含14个Skill这些Skill并不是杂乱无章的而是按照职责分成了四层覆盖了从需求理解到代码合并的全开发流程。每一层的Skill都有明确的职责而且层与层之间有严格的前置依赖——没有完成上一层的任务就无法进入下一层就像工厂的生产线一样必须按顺序执行不能跳过任何一个环节。我们先来看一下这14个Skill的全景分布以及一个典型开发任务的完整编排流程这样能让我们对Superpowers的工作逻辑有一个整体的认知。3.1 Skill的四层架构Superpowers的14个Skill按职责分为四层每层各司其职相互配合形成了一个完整的开发闭环第一层意识植入层。核心Skill是“using-superpowers”作用是让Claude Code明确知道当前项目启用了Superpowers框架必须严格遵循所有Skill规则。这就相当于给AI“打预防针”让它从一开始就树立“按规矩办事”的意识避免它忽略后续的规则约束。第二层需求对齐与计划层。包含“brainstorming”和“writing-plans”两个核心Skill主要负责解决“需求模糊”和“任务混乱”的问题。先通过brainstorming和用户对齐需求细节再通过writing-plans把任务拆分成可执行的小步骤确保AI在动手前已经完全理解需求并且知道自己要做什么、怎么做。第三层开发与验证层。这一层是核心包含了“using-git-worktrees”“subagent-driven-development”“executing-plans”“test-driven-development”“requesting-code-review”“verification-before-completion”等多个Skill。主要负责执行开发任务、确保开发环境隔离、验证代码正确性避免AI盲目开发、忽略测试和审核。第四层收尾层。核心Skill是“finishing-a-development-branch”主要负责开发任务完成后的收尾工作比如合并开发分支、清理开发环境、更新文档等确保整个开发流程的完整性避免出现“开发完成就不管”的情况。3.2 典型开发任务的编排流程了解了四层架构后我们再来看一个典型的开发任务从需求提出到任务完成Superpowers是如何编排14个Skill强制约束AI行为的。整个流程的顺序的是固定的有严格的前置依赖跳不过任何一个环节using-superpowers意识植入AI首先扫描项目的skills/目录确认启用了Superpowers框架明确自己必须遵循所有Skill规则这是整个开发流程的起点。brainstorming苏格拉底式需求对齐9步AI不会直接动手写代码而是先通过9个步骤和用户对齐需求细节确保自己完全理解需求避免因需求模糊导致开发偏差。writing-plans拆分任务每步2-5分钟需求对齐后AI会把整个开发任务拆分成多个2-5分钟就能完成的小步骤每个步骤都明确包含具体的文件路径和代码片段确保任务可执行、可跟踪。using-git-worktrees创建隔离环境在执行开发任务前AI会创建一个隔离的git工作区避免直接修改主分支的代码防止开发过程中影响其他功能也方便后续回滚。subagent-driven-development或executing-plans执行任务AI会根据拆分好的计划执行开发任务。这里有两种选择如果任务比较复杂会启用subagent-driven-development让独立的子Agent执行任务确保执行质量如果任务比较简单会直接执行executing-plans按步骤完成代码编写。每个任务完成后必须执行三个验证环节三者并行或按顺序执行test-driven-developmentTDD验证强制执行“RED→GREEN→REFACTOR”流程先写一个失败的测试用例确认测试报错再写最小化的业务实现最后确认测试通过确保代码的正确性。requesting-code-review两阶段审查对编写的代码进行两轮审查第一轮核对是否符合计划规格确保没有偏离任务要求第二轮审查代码质量比如代码可读性、规范性、是否有冗余等。verification-before-completion证据确认AI必须提供代码运行的完整结果比如测试报告、运行截图等证明自己的修改是正确的没有隐藏bug。没有证据任务就不算完成。finishing-a-development-branch收尾合并所有任务完成且验证通过后AI会进行收尾工作合并开发分支到主分支清理隔离环境更新相关文档确保整个开发流程闭环。这里有一个非常关键的设计要点层与层之间、步骤与步骤之间的前置依赖是通过提示词中的标签和Checklist来约束的。比如在brainstorming的Skill文件中会有一个标签明确规定“必须完成用户审阅才能进入writing-plans阶段”在writing-plans的Skill文件中也会有类似的约束明确“必须拆分完所有任务才能进入执行阶段”。这种“卡点式”约束彻底解决了AI“跳步骤”的问题。以前AI可能会跳过需求对齐直接动手写代码跳过测试直接提交代码。但有了标签和ChecklistAI必须完成上一步的所有要求才能进入下一步否则就会卡住无法继续执行。这就像考试一样必须完成前面的题目才能做后面的题目确保每一步都做到位。四、深度拆解4个核心Skill的设计思路看懂AI约束的底层逻辑了解了Skill的全景图和编排流程后我们再来拆解几个核心Skill的内部设计。这4个Skill是Superpowers的“灵魂”它们的设计思路直接决定了AI开发行为的规范性和产出质量。看懂这4个Skill你就能明白Superpowers到底是如何“管住”AI的。4.1 brainstorming9步需求对齐彻底解决“需求模糊”很多人以为brainstorming就是和用户聊两句问问需求细节但Superpowers的brainstorming并不是随便聊而是定义了严格的9个步骤每一步都有明确的目标确保需求对齐的完整性和准确性。这9个步骤层层递进从“理解上下文”到“移交实现”彻底避免了AI因需求模糊而导致的开发偏差。我们逐一拆解这9个步骤看看每个步骤的具体作用步骤1探索上下文。AI首先会扫描整个项目的结构查看现有代码的逻辑、目录结构、依赖包等了解项目的现有状态。比如项目是用什么框架开发的用户模型已经有哪些字段路由是如何配置的。这样做的目的是让AI避免重复开发也避免修改原本正常的代码确保开发的连贯性。步骤2可视化辅助。AI会提供架构图、流程图等视觉化工具把自己理解的需求和项目结构呈现给用户帮助用户更直观地判断AI的理解是否正确。比如AI会画一个用户注册功能的流程图标注出手机号校验、验证码发送、密码校验、数据存储等环节让用户一眼就能看出AI是否理解了自己的需求。步骤3澄清提问。AI会通过单个问题逐步挖掘需求的目标、约束、判断标准等细节而不是一次性抛多个问题。这里有一个非常细节的设计每次只问一个问题。因为如果一次抛三个问题用户往往只会回答最好答的那个忽略其他关键问题导致需求对齐不完整。比如AI不会问“你要的注册功能需要支持哪些字段密码强度有什么要求是否需要短信验证”而是先问“注册功能需要支持哪些字段”等用户回答后再问下一个问题。步骤4提出方案。AI会根据用户的回答给出2-3个可选的实现方案并详细评估每个方案的利弊。比如用户要求注册功能支持手机号验证码注册AI会给出“使用第三方短信接口”和“自建短信服务”两个方案分别说明前者的优势是开发速度快、成本低劣势是依赖第三方后者的优势是可控性强劣势是开发周期长、需要维护服务器。让用户根据自己的项目需求选择最合适的方案。步骤5展示设计。AI会分段向用户呈现设计细节进行增量确认。比如先展示用户模型的字段设计让用户确认再展示路由配置让用户确认最后展示控制器的逻辑让用户确认。这样做的目的是避免一次性展示太多内容用户看不过来导致遗漏关键问题。增量确认能确保每个设计细节都符合用户的预期。步骤6写设计文档。AI会把确认后的设计细节写入项目的docs/plans/目录下生成一份完整的设计文档。这份文档会包含需求目标、实现方案、核心逻辑、接口设计等内容既是后续开发的依据也是后续维护的参考。这样一来即使后续有其他开发者接手也能快速了解这个功能的设计思路。步骤7自审。AI会对自己写的设计文档进行自我审查检查是否有逻辑漏洞、是否有遗漏的需求、是否符合项目规范等。比如AI会检查设计文档中是否明确了密码强度的校验规则是否考虑了异常情况比如手机号格式错误、验证码过期等确保设计文档的完整性和准确性。步骤8用户审阅。AI会把设计文档提交给用户让用户进行最终审阅。用户可以提出修改意见AI会根据用户的意见修改设计文档直到用户确认无误。这一步是需求对齐的关键确保设计文档完全符合用户的需求避免后续开发出现偏差。步骤9移交实现。需求对齐和设计文档确认后AI会转入writing-plans Skill开始拆分开发任务。在brainstorming的SKILL.md文件中有一行明确的规则REQUIRED SUB-SKILL: Use superpowers:writing-plans to create the implementation plan.这就是前面提到的“提示词链”——没有任何代码在控制逻辑全靠这行大写加粗的提示词去“命令”大模型调起下一个Skill。说穿了这就是用自然语言写的“函数调用”通过提示词的引导让AI自动进入下一步流程。通过这9个步骤brainstorming Skill彻底解决了AI“需求理解偏差”的问题。它让AI从“被动接受需求”变成“主动对齐需求”确保每一个开发动作都基于清晰、明确的需求从根源上避免了“做无用功”。4.2 writing-plans拆分微任务防止AI“跑偏”很多时候AI开发出现偏差不仅是因为需求理解不清晰还因为任务拆分太粗糙。比如一个“用户注册功能”的开发任务如果只拆分成“写注册接口”“写校验逻辑”两个大步骤AI在执行的时候很容易出现逻辑混乱比如先写校验逻辑再写接口导致接口无法正常调用或者遗漏某个细节比如忘记添加验证码过期处理。而writing-plans Skill的核心作用就是强制AI在动手写代码前把任务拆分成“极细”的颗粒度——每个步骤必须在2-5分钟内可完成并且每个步骤都要明确包含“具体文件路径”和“代码片段”确保AI在每个微步骤上都能保持清醒不跑偏、不遗漏。为什么要拆分成2-5分钟可完成的微步骤因为大模型的上下文窗口虽然很大但逻辑链条一长就容易出现“幻觉”和“遗忘”。比如一个需要30分钟完成的大任务AI执行到一半可能会忘记前面的需求细节或者出现逻辑矛盾导致代码报错。而拆分成2-5分钟的微步骤AI每次只需要专注于一个小任务既能避免遗忘也能减少幻觉确保每个步骤的执行质量。举个例子用户注册功能的任务拆分在writing-plans Skill的约束下可能会拆分成这样的微步骤打开models/User.js文件添加phone手机号、code验证码、codeExpire验证码过期时间三个字段字段类型分别为String、String、Date其中phone为必填项且唯一。预计3分钟打开routes/auth.js文件添加POST类型的/register路由路由参数为phone、code、password绑定registerController控制器的register方法。预计2分钟打开controllers/registerController.js文件编写register方法的基础结构引入User模型获取请求参数phone、code、password。预计2分钟在register方法中添加手机号格式校验逻辑使用正则表达式校验手机号是否符合11位数字格式不符合则返回错误信息。预计3分钟在register方法中添加验证码校验逻辑查询数据库中该手机号对应的验证码判断验证码是否存在、是否过期不符合则返回错误信息。预计4分钟在register方法中添加密码强度校验逻辑要求密码长度不小于8位包含字母和数字不符合则返回错误信息。预计3分钟在register方法中编写数据存储逻辑将phone、password加密后存入数据库返回注册成功信息。预计3分钟这样的拆分每个步骤都非常具体AI只需要按照步骤一步步执行就能完成开发任务不会出现跑偏、遗漏的情况。而且每个步骤的预计时间都在2-5分钟内AI能专注于当前步骤确保执行质量。另外Plan写完后AI会在文件中添加一段注释指导下一步的执行For agentic workers: REQUIRED SUB-SKILL: Use superpowers:executing-plans to implement this plan task-by-task.Claude Code读到这行注释后就会自动调用executing-plans Skill按照拆分好的计划逐一执行每个微步骤。整个流程的编排全靠提示词里的这些“路由指令”串起来不需要任何额外的代码控制简单又高效。writing-plans Skill的设计思路本质上是“化整为零”——把复杂的开发任务拆分成简单、可执行的微步骤让AI在每个步骤上都能保持专注避免因任务过于复杂而出现混乱。这就像我们做项目一样把一个大项目拆分成多个小任务每个小任务逐一完成最终就能高效、高质量地完成整个项目。4.3 subagent-driven-development执行与审核分离提升代码质量很多人用AI写代码都会遇到一个问题AI自己写的代码自己很难发现问题。就像我们自己写代码往往会陷入“当局者迷”的误区忽略一些明显的bug或不规范的地方。而subagent-driven-development Skill的核心设计思路就是“执行与审核分离”——让独立的子Agent执行开发任务完成后再由其他子Agent进行审核避免“自己写、自己审”的弊端提升代码质量。具体来说这个Skill的执行流程是这样的主Agent根据拆分好的计划创建一个独立的子Agent专门负责执行当前的开发任务。这个子Agent只专注于“写代码”不需要考虑审核、验证等其他事情确保执行效率。子Agent完成开发任务后会将写好的代码提交给主Agent主Agent再创建两个独立的审核子Agent进行两轮审查。第一轮审查由第一个审核子Agent负责核对代码是否符合Plan的规格。比如检查代码是否修改了Plan中指定的文件是否实现了Plan中要求的功能是否符合Plan中的逻辑要求。如果不符合就反馈给执行子Agent让其修改。第二轮审查由第二个审核子Agent负责审查代码质量。比如检查代码的可读性、规范性是否有冗余代码是否有潜在的bug是否符合项目的编码规范等。如果发现问题就反馈给执行子Agent让其修改。执行子Agent根据审核意见修改代码直到两轮审查都通过才算完成当前任务。这种“执行与审核分离”的设计有两个非常明显的优势第一个优势避免“当局者迷”。执行子Agent专注于写代码不会受到审核思维的干扰能提高执行效率而审核子Agent不参与代码编写能以客观的视角发现执行子Agent忽略的问题确保代码质量。就像一个团队有人负责开发有人负责测试分工明确才能提升整体产出质量。第二个优势减少AI的“自我肯定偏差”。AI很容易对自己写的代码产生“自信”即使有问题也很难自己发现。而独立的审核子Agent不会受到这种“自信”的影响能严格按照规则进行审查确保代码符合要求。比如执行子Agent在写用户注册的密码加密逻辑时可能会忽略密码加密的安全性使用简单的MD5加密这种加密方式安全性较低。而审核子Agent在审查时会发现这个问题反馈给执行子Agent让其修改为更安全的bcrypt加密方式从而提升代码的安全性。subagent-driven-development Skill的设计思路本质上是“分工协作”——通过拆分执行和审核两个角色让AI之间相互监督、相互配合避免单一Agent的局限性从而提升代码质量。这种思路也和我们现实中的开发团队分工不谋而合体现了Superpowers对“工程化流程”的深刻理解。4.4 test-driven-development证据先于断言杜绝“虚假完成”AI最让人头疼的一个问题就是“虚假完成”——明明代码有bug却自信地说“已经改好了可以正常运行”。而test-driven-developmentTDD测试驱动开发Skill的核心作用就是强制AI“用证据说话”杜绝这种“虚假完成”的情况。它要求AI必须强制执行“RED→GREEN→REFACTOR”的流程没有完整的测试证据任务就不算完成。我们先回顾一下TDD的核心流程RED红→GREEN绿→REFACTOR重构。简单来说就是先写一个失败的测试用例RED确认测试报错再写最小化的业务实现让测试通过GREEN最后优化代码结构提升代码质量REFACTOR。而Superpowers的TDD Skill就是把这个流程变成了AI必须遵守的规则。具体来说AI在执行开发任务时必须按照以下步骤进行先写测试用例AI根据Plan中的功能要求编写测试用例测试用例需要覆盖所有的功能点和异常情况。比如用户注册功能的测试用例需要包含“手机号格式正确、验证码有效、密码符合要求注册成功”“手机号格式错误注册失败”“验证码过期注册失败”“密码不符合要求注册失败”等场景。运行测试用例确认测试失败REDAI运行编写好的测试用例确认测试用例报错。这一步的目的是确保测试用例是有效的——如果测试用例一开始就通过说明测试用例没有覆盖到核心功能或者测试逻辑有问题。只有测试失败才能进入下一步。编写最小化业务实现AI根据测试用例的要求编写最小化的业务代码只实现测试用例所需的功能不添加多余的逻辑。比如测试用例要求“手机号格式正确才能注册”AI就只编写手机号格式校验的逻辑不添加其他无关的功能。再次运行测试用例确认测试通过GREENAI运行测试用例确认所有测试用例都通过。这一步AI必须提供完整的测试运行结果比如测试报告、运行截图等证明测试确实通过了。重构代码REFACTOR测试通过后AI会优化代码结构提升代码的可读性、规范性和可维护性。比如简化冗余代码、提取公共方法、添加注释等但不会改变代码的功能——重构后测试用例依然要能通过。这里的关键的是AI必须提供“完整的证据”包括测试用例的代码、测试失败的输出、测试通过的输出、重构后的代码。没有这些证据Superpowers就会判定任务没有完成AI无法进入下一步流程。举个例子AI在开发用户注册的密码校验功能时按照TDD流程会先写一个测试用例要求密码长度不小于8位包含字母和数字。运行测试用例后测试报错RED因为此时还没有编写密码校验逻辑。然后AI编写密码校验的逻辑再次运行测试用例测试通过GREEN并提供测试运行结果的截图。最后AI优化密码校验的代码提取成一个公共方法完成重构。TDD Skill的设计思路本质上是“证据驱动”——不相信AI的“口头断言”只相信实实在在的测试证据。这就像我们做实验一样只有提供完整的实验数据和实验结果才能证明实验结论是正确的。对于AI开发来说只有提供完整的测试证据才能证明代码是正确的避免“虚假完成”带来的隐患。五、不止于开发Superpowers的模式迁移解锁更多AI应用场景虽然Superpowers是为软件开发设计的但它的核心思路——“元指令 结构化约束”并不是只能用在开发场景。只要是需要AI按流程完成任务、产出可验证结果的场景都可以借鉴Superpowers的模式把经验写成规则把流程交给工具执行让AI的产出更靠谱、更可控。下面我们举两个常见的场景看看Superpowers的模式如何迁移应用帮助我们提升工作效率。5.1 自动化调研从“碰运气”到“走流程”很多人用AI做调研都是直接丢一个需求比如“帮我调研一下人工智能在教育领域的应用现状”然后AI就会生成一篇杂乱无章的报告内容东拼西凑没有逻辑也没有明确的结论。这就是因为没有给AI设定调研流程AI只能“碰运气”式地整合信息无法保证调研的完整性和准确性。借鉴Superpowers的模式我们可以给AI设定一套“调研SOP”通过Skill文件强制约束AI的调研行为让调研从“碰运气”变成“走流程”。具体来说可以设计这样几个核心Skill关键词梳理AI先梳理调研主题的核心关键词比如“人工智能教育应用”的关键词可以是“AI教育场景”“AI教育工具”“AI教育优势”“AI教育挑战”等确保调研方向不偏离。信息搜集AI根据梳理的关键词逐一搜集相关信息每个关键词对应一个信息搜集步骤并且每个步骤都要明确信息来源比如权威网站、学术论文、行业报告等确保信息的可靠性。信息提取AI对搜集到的信息进行提取提炼核心观点、数据、案例剔除无关信息确保信息的针对性。矛盾核对AI对比不同来源的信息找出其中的矛盾点比如不同报告中关于“AI教育市场规模”的数据不一致AI需要标注矛盾点并分析矛盾产生的原因。结论整合AI根据提取的信息和矛盾核对结果整合出调研结论形成完整的调研报告并且提供所有信息来源的链接方便用户验证。通过这样的流程约束AI的调研行为会变得有序、可控。它不会再东拼西凑信息而是按照“关键词梳理→信息搜集→信息提取→矛盾核对→结论整合”的步骤一步步完成调研任务产出的调研报告也会更完整、更准确、更有参考价值。5.2 企业审批流自动化校验提升审批效率企业审批流是一个非常繁琐的工作比如员工报销审批需要人工校验报销附件的格式、金额的合理性、审批层级的正确性不仅耗时耗力还容易出现错误。而借鉴Superpowers的模式我们可以给AI设定一套“审批SOP”让AI自动完成审批流程的校验和推进提升审批效率。具体来说可以设计这样几个核心Skill附件校验AI自动校验报销附件的格式比如是否为PDF或图片格式附件是否完整比如是否有发票、消费凭证等不符合格式或附件不完整的自动退回并提示用户补充。金额校验AI自动核对报销金额的合理性比如是否超过公司规定的报销标准是否有重复报销的情况金额计算是否正确不符合要求的自动退回并提示用户修改。审批层级判断AI根据报销金额、报销类型自动判断审批层级比如金额小于1000元由部门主管审批金额在1000-5000元由部门主管和财务主管审批金额大于5000元由部门主管、财务主管和总经理审批。摘要生成与推送AI自动生成报销审批摘要包含报销人、报销金额、报销类型、附件情况等信息然后推送到对应审批人的工作群组提醒审批人进行审批。审批结果反馈审批完成后AI自动将审批结果通过或驳回反馈给报销人并标注驳回原因方便用户修改后重新提交。通过这样的流程约束AI可以自动完成审批流程中的大部分繁琐工作减少人工干预提升审批效率同时也能避免人工校验出现的错误。这就是Superpowers模式的价值——把重复、繁琐的流程交给AI按规则执行让人从繁琐的工作中解放出来专注于更有价值的事情。除了这两个场景Superpowers的模式还可以迁移到很多其他场景比如内容创作、客户服务、数据分析等。只要我们能把自己的工作经验整理成清晰的规则和流程就能用Superpowers的思路给AI装上“顶级SOP”让AI成为我们的“得力助手”而不是“添乱帮手”。六、写在最后AI靠谱靠的不是聪明是规矩拆完Superpowers我最大的感受就是AI产出靠谱靠的不是模型更聪明而是规矩更死。很多人一味追求更强大的AI模型却忽略了一个关键问题即使是最强大的模型如果没有流程约束也会乱了章法产出的结果也无法保证质量。而Superpowers的出现恰恰给我们提供了一个新思路与其依赖模型的“聪明”不如给模型立好“规矩”。在AI辅助开发的时代程序员的角色正在发生变化。以前我们的核心工作是“写代码”而现在写代码这件事AI越来越能干我们的核心工作正在变成“定义规矩”——定义“怎么写代码、按什么顺序写代码、怎么验证代码写对了”这套SOP。很多人把Claude Code当更聪明的Copilot用只让它帮忙写代码这其实浪费了它大部分的能力。更有价值的做法是把自己的工程经验、工作流程固化成SKILL.md文件让Claude Code按你的方式工作。你不需要再反复提醒AI“先理解需求”“写完做测试”因为这些已经变成了AI必须遵守的规则它会自动执行。未来代码会越来越廉价。随着AI模型的不断迭代写代码的成本会越来越低甚至不需要人亲自写代码。但经过验证的工作流会越来越值钱。因为工作流承载的是程序员的经验、智慧和行业认知是AI无法轻易替代的。而Superpowers就是帮助我们把这些“值钱的工作流”固化成可执行的规则让AI成为我们经验的“传承者”和“执行者”。对于正在用AI辅助开发的程序员来说Superpowers不仅是一套工具更是一种思维方式它让我们明白AI的价值不在于它能“自动写代码”而在于它能“按我们的规矩写代码”。与其抱怨AI不够靠谱不如静下心来整理自己的工作流程给AI装上一套“顶级SOP”。当AI能严格按照你的规则工作能主动对齐需求、拆分任务、验证结果你就会发现AI不再是“添乱的帮手”而是能帮你提升效率、解放双手的“得力伙伴”。而这也是Superpowers带给我们的最大启示AI的终极价值是成为人类经验的延伸而不是替代人类。

更多文章