第七部分:如何让 Agent 完整地做完任务?

张开发
2026/4/6 14:59:04 15 分钟阅读

分享文章

第七部分:如何让 Agent 完整地做完任务?
一个让人哭笑不得的场景你让 agent “给这个项目加上用户认证功能”。它干劲十足,上来就开始改代码——两小时后你一看:12 个文件被修改,800 行新代码。但问题是——没有一个功能是端到端跑通的。数据库 schema 改了,但迁移脚本没写路由定义了,但返回格式是错的前端组件加了,但按钮点了没反应顺手重构了错误处理中间件,结果原来的功能全挂了贪多嚼不烂,这句话放到 AI agent 身上格外贴切。Agent 天生就有"多做一点"的冲动——看到相关的事情就顺手一起做了,和那种在超市本来只打算买瓶酱油、结果推着满满一车出来的人一个德行。问题是,人类买了太多东西最多浪费钱,agent 同时做太多事情则是每一件都做不好。注意力是有限的资源这不是比喻,是数学。假设 agent 的上下文容量为 C,同时激活 k 个任务,每个任务平均获得 C/k 的推理资源。当 C/k 低于完成单个任务所需的最小阈值时,所有任务都做不完。这就像你的胃就那么大——同时塞十个包子进去,十个都消化不良。Claude Code 的真实行为很说明问题。你让它"添加用户注册功能",它很可能这样做:创建 User model/

更多文章