【ai agent/ai ide/命令行ai工具】prompt/context/harness ;mcp;skills;个人使用skills;学习的skill仓库

张开发
2026/4/8 12:58:36 15 分钟阅读

分享文章

【ai agent/ai ide/命令行ai工具】prompt/context/harness ;mcp;skills;个人使用skills;学习的skill仓库
agent参考【万字揭秘】2025年最大风口Agent 智能体到底是什么_哔哩哔哩_bilibili说明ai agent是什么大语言模型本质上擅长理解文字回答我们的问题、问一些问题、聊聊天。但是面对更复杂、需要多步骤执行、跟外界交互的任务时它就有点无能为力了。很多时候任务能不能完成还得我们自己动手。所以很多人早期都把AI当成了一种高级的搜索引擎在用Agent的核心就是要让AI能够真正实现自主完成任务就是当AI收到一个任务时它不仅要自己去想应该怎么做还得要自己真的去做所谓AI Agent就是代表人类去完成具体任务的AI讲解了agent的感知能力单纯的大语言模型是依靠海量的文本数据训练出来的基础的感知方式就是接收用户输入的文本。但如果我想把图片或者 PDF 传给他看或者能不能跟他语音交流呢利用 OCR 这种中间工具把图片或 PDF 转成文本再输入给大模型。但人们会发现只提取其中的文字势必会丢失非常多的信息比如图片的颜色布局、声音的语气语调等2023 年 GPT-4 有了视觉版本开启了多模态模型的初级阶段规划能力思维树就是让大模型想好几种不同的思路选最好的那个但这样效果也一般因为早期的大模型本质上就不擅长规划人们还有另一个思路分好几个模型各个AI各司其职协作完成任务这个就叫Multi-agent多智能体工作流。不过了解Coze、DeepSeek 这类平台的朋友应该都有感受这都治标不治本中间的步骤都是人定好的一旦换了新任务还得重新设计OpenManus24年研究并发布了O1O系列模型也就是让大模型内化学会在每一次回答问题之前都有一个自主的推理过程行动能力当模型觉得需要调用工具时它会生成一段 API 调用的文本生成这段文本后会有一个过滤机制识别导于是找到对应的功能函数并调用。等计算器完成计算后结果会发回给大模型再由大模型返回答案。这就是最早的 Function Calling 大模型每个工具都要单独接入、单独开发实在太麻烦了Anthropic在24年11月推出mcp记忆能力RAGRetrieval-Augmented Generation检索增强生成后面还说了agent的发展阶段编程agent、搜索agent、医疗agent最后主要讲Manus理解Agent的核心就是要让AI能够真正实现自主完成任务ai ide我的理解是 把编程的agent和IDE环境进行了融合一个孤立的 Agent 只能看到你给它的那段代码。而 AI IDE 会主动扫描整个项目为 Agent 构建项目索引AI IDE 通过工具调用Tool Calling协议让 Agent 可以直接使用 IDE 内置的工具AI IDE 提供了全新的交互方式比如通过聊天窗口提任务结果审查命令行 AI Agent它们就是运行在终端Terminal里的编程 Agent比如OpenCode 和 Claude Code我个人的感受比如在我有一个项目而需要参考另一个项目的时候这个命令行agent的跨文件处理任务就很不错而且直接在终端使用直接操作文件系统更高效占用内存少毕竟qodertrae这种都是用vscode的壳子electron占用内存太大了prompt engineering提示词工程context engineering上下文工程harness engineering控制工程Prompt Engineering (PE)Agent 开发者他们在写代码构建“提示词模板生成器”研究怎么通过算法自动优化提示词让模型在大规模并发下保持低成本和高准确率。你你只需要在对话框里把话说明白。Context Engineering (CE)Agent 开发者他们在写复杂的向量数据库检索逻辑RAG、设计记忆压缩算法怎么把 100 页的会议记录压缩成 1 段话塞给 AI、管理长短期记忆的滑动窗口。这是纯代码工作。你你只需要点击“文件”或者把文档拖进去。Harness Engineering (HE)Agent 开发者这是最硬核的。他们在搭建沙箱环境、编写自动化测试脚本、设计“AI 写代码 - 运行测试 - 报错 - AI 自动修 - 再测试”的死循环系统。这需要极强的后端架构能力。你你只需要看 AI 生成的代码能不能跑通不能跑通就复制报错信息给它。工程技术在智能体优先的世界中利用 Codex | OpenAI根据文章描述他们的工作主要集中在以下几层这些都需要极强的工程能力搭建“马具”The Harness文章提到他们构建了一个环境让 Codex 可以直接调用gh(GitHub CLI)、运行本地脚本、甚至控制 Chrome 浏览器来验证 UI。这些“连接器”Connectors和“工具”Tools本身是需要代码的。普通 AI IDE如 Trae已经内置了这些但他们是自己造的轮子。编写“元规则”他们写了一套极其严格的 Linter代码检查器和架构规范。例如他们强制规定了代码层之间的依赖方向Types - Config - Repo...。这些规则代码是让 AI 能写出合格代码的前提。构建“沙盒”他们让 AI 拥有完全的可观察性Logging, Metrics甚至接入了 DevTools。这意味着他们必须先搭建好这套监控系统让 AI 能“读懂”错误而不是人类去读。结论他们是在用代码去构建一个能运行 AI 的操作系统而不是在写应用软件。他们的工作流 vs. 你的工作流你担心的是“难道他们也是看能不能跑通不能跑通就复制报错信息”绝对不是。维度你普通后端 AI IDE他们OpenAI 文章中的团队错误处理人工介入。AI 报错 - 你看日志 - 你复制错误 - 你问 AI - AI 修。你是循环的一部分。全自动闭环。AI 报错 -系统自动把日志喂给 AI - AI 生成修复代码 -系统自动运行测试 - 直到通过。人类不在循环中。反馈来源你的大脑经验 报错信息。自动化工具Chrome DevTools, Prometheus, Linter。这些工具直接告诉 AI 哪里错了。开发模式交互式。你和 AI 一问一答。代理式Agent。人类下达一个宏观指令如“实现登录功能”然后去睡觉。AI 自己折腾 6 个小时直到搞定。核心资产写好的业务代码。Prompt 模板 架构规则 自动化验证脚本。harness engineering我决定不再review AI生成的代码了_哔哩哔哩_bilibili这个视频算是吐槽了用ai生成代码然后自己review很麻烦吧up还说之后要用测试来测试代码 类似tdd一样评论这思路已经过时了可以看下最近提的harness agent flowhttps://www.anthropic.com/engineering/harness-design-long-running-apps 可以看下a公司的这篇。目前可落地的部署工作流的有 langchain 下面的 langGraph、openHands这类的项目。它是什么Harness Engineering是什么为什么最近热度这么高_哔哩哔哩_bilibili视频prompt engineering解决的是怎么说context engineering解决的是给它看什么harness engineering解决的是让他在什么规则里头干活这个视频简单讲解了指令工程、上下文工程、控制工程这三个评论新瓶装旧酒罢了大模型本质上就是通过控制输入得到确定性的输出。一两句说不明白就多说两句返回的结果不好就调整输入闭环来几遍评论…… 先是为了彰显Agent的牛逼和Workflow彻底割席。 然后发现步子太大扯着了纯靠Agent有幻觉、不稳定又回来捡Workflow。 但是又不能这么说怎么办那就造个新词。 …… Harness Engineering说白了就是实践证明大模型不能彻底放手需要在有设计的系统架构下在优势区间发挥功能。三者关系最近爆火的 Harness Engineering 到底是啥一期讲透_哔哩哔哩_bilibili这三者也不是替代关系而是包含关系Prompt 是对指令的工程化Context 是对输入环境的工程化Harness 是对整个运行系统的工程化。Harness Engineering驾驭工程翻译成编排工程好些驾驭工程更准确把主要说是让人去驾驭ai不仅仅是编排ai工作流这么说来不就是架构嘛以前的基础架构是服务于人的因为主要是人在写代码。未来的架构是服务于 Agent 的因为大部分代码会被 Agent 编写。未来如果大部分代码都由 Agent 编写人就是服务于他们的秘书了我感觉上像是领导因为要让agents怎么做做什么等等但实际行动上更像是一个什么秘书安排agent的行动、做什么东西要提前准备好给agent看让它知道做什么很麻烦啊当然也是对于复杂问题而言rules全局的规则MCP视频教学火遍全网的MCP是什么怎么用如何自己开发一个MCP服务一个视频带你入门_哔哩哔哩_bilibili讲解了mcp视频早期大模型交互依赖手动复制粘贴后来出现的 Function Calling不过虽然能让模型通过数据接口调用工具但各厂商标准不统一导致开发者需要为不同模型定制接口MCP 通过制定统一标准接口使得开发者只需开发一个服务就能被所有支持 MCP 的大模型调用演示了mcp的在线体验和本地使用开源工具Cherry studioMCP是啥技术原理是什么一个视频搞懂MCP的一切。Windows系统配置MCPCursor Cline使用MCP_哔哩哔哩_bilibili视频MCP本身没有什么神秘的它的本质就是客户端用命令行调用了电脑上的Node.js程序然后程序执行了某些操作再把结果返回回来。当然也不仅限于Node.js程序有可能是Python的Skills视频教学手把手彻底学会 Agent Skills【小白教程】_哔哩哔哩_bilibili视频使用claude code演示说明了下面四个SKILL.md指令只在需要时加载节省Token并提升准确性references文件夹AI会根据Skill.md中的指引只加载任务所需的特定参考文件避免不必要的Token浪费和信息干扰scripts文件夹用于存放可执行脚本assets文件夹用于存放资源问skills不就是写提示词吗弹幕skill工程化和流程化提示词集成度更高这个视频讲解了SKILL.md文档还有其他文件夹浅显但够用作为了解不错【2026版Agent Skills保姆级教程】2小时从会用到会造全方位提升工作效率。Claude Skills、Agent技能、OpenCode_哔哩哔哩_bilibili这个视频演示了安装opencode然后说明skill的来历演示了安装和使用skill按照官方文档说明了skill的规则SKILL.md还有其他三个文件夹演示开发skill用官方提供的创建skill的skill来演示创建skill说明了skill的使用场景最后1p还列出了claude code、opencode、cursor等项目级目录和全局目录的位置这个视频还给出了安装步骤仓库地址更像一个教学视频在看完上面的视频之后学习这个更完善文档说明Agent Skills开放标准这是Anthropic推动的跨平台标准Overview - Agent Skills这个文档对agent的skills有一个大概的说明虽然我主要看的是视频【2026版Agent Skills保姆级教程】2小时从会用到会造全方位提升工作效率。Claude Skills、Agent技能、OpenCode_哔哩哔哩_bilibili这1p的视频有说skills本来是Anthropic公司推出来用来增强自家的claude code的功能但是后来大家发现这太好用于是行业纷纷跟进25年12月18日官方正式将Agent Skills发布成一个跨平台、跨产品可复用的标准ai ide或者命令行ai工具等都可以去各自的官网查看各平台存放Skills的文件夹名称不同如.claude vs .qoder vs .cursorqoderSkills - Qoder这是qoder的skills的文档我看这里目录结构和看的视频不同但我觉得以及问了ai只要在 SKILL.md 中通过 Markdown 链接显式引用就行我看了qoder和trae的关于skills的文档说明目录都有些差异我还看了cursor的文档说明里面到是SKILL.md、references文件夹、scripts文件夹、assets文件夹还贴出了Anthropic的Agent Skills的地址下载skill04-下载skills_哔哩哔哩_bilibili官方仓库anthropics/skills: Public repository for Agent SkillsSkills社群网站Agent Skills 市场 - Claude、Codex 和 ChatGPT Skills | SkillsMP腾讯的说是专为中国用户优化的Skills社区这个skill下还有相关的实践比如别人的文章或者视频等感觉还可以不管内容是真的少Skill Hub 中国 - 实战 Skill 案例与可复用方案库skill.sh市场The Agent Skills Directory使用skill05-使用skill做企业网站设计_哔哩哔哩_bilibili前端设计后面几p还有使用excel的skill生成视频的skillCustom commands合并到skills里官方已经将commands去掉了合并到skills里了个人使用skills【建议收藏】2026 最实用的 Skills 清单_哔哩哔哩_bilibili下面这些都是anthropic公司的官方skills可以在官方仓库找到我用skills.sh市场下载pptx创建和编辑演示文稿xlsx创建和分析电子表格docx by anthropics/skillsdocx创建和编辑文档pdf生成pdf文档ui-ux-pro-max提升ai的ui审美remotion-best-practices by remotion-dev/skills产品发布视频这类动态效果用代码拼出来。你给脚本和风格方向AI就能生成可渲染的视频工程。文字排版、转场节奏、基础动画都有支持skill-creator by anthropics/skillsskill-creator创建skill的skiifind-skills by vercel-labs/skills能帮助搜索skill同时把对应的安装命令给你agent-browser让agent看懂和操作网页文档中有说明不光要安装skill文档教你如何使用 agent-browser 命令还要安装agent-browser CLI 工具实际执行浏览器自动化的命令行工具superpowers开源 Claude Code 工程级开发插件 Superpowers 完整上手攻略 - 知乎Superpowers 提供了一套面向 AI 编程的工程化开发流程。通过子智能体驱动开发和技能系统化设计将 TDD、代码审查、设计文档等传统工程实践与 AI 智能体能力结合起来使开发过程更加结构化也更容易管理superpowers 使用心得分享竟还能优化_哔哩哔哩_bilibili它本身是有14个skillbrainstormihng头脑风暴它的作用是将用户的一个需求来刨根问到底担任了需求分析的角色那他的一个很重要的点就是他每次只问一个问题就算你有多个问题啊但是他也只问你一个问题不像cladue code、codex他们可能会提出一批问题然后让你自己去选git-worktrees你可能会在一个项目上面来进行多个AI coding定的一个开发。然后为了避免这个分支的一个干扰和污染啊所以它会通过这个原生的这个git-worktrees进行隔离up不是很喜欢因为他还有一些前端开发没办法很及时的去看到一个页面的效果编写计划一个需求搞完之后啊就要去编写这个计划它还会有一个review它写的一个计划。这个计划里面非常详细可能有1000多行的一个计划甚至包含了这个详细的一个代码实现执行计划执行编写的计划就是subagent的开发会有一个规范就是两阶段的一个审查这个审查是一定会有的在交给subagent的来写完代码之后一定会触发这个space这个review关于你之前的这个需求有有没有偏离和code的review测试驱动开发的technical-writing by supercent-io/skills-template1. technical-writing (技术写作)用途帮助你编写各类技术文档包括- 技术规格说明书 (Technical Specification)- 架构文档 (Architecture Document)- 运维手册 (Runbook)- 变更日志 (Changelog)包含内容- 5种文档类型的模板- 针对不同受众的写作策略开发人员、运维、管理层、终端用户- Mermaid图表、流程图、代码示例的使用指南- 写作最佳实践和自检清单frontend-design前端设计飞书feishu-doc - Agent Skill by openclaw | SkillsMPtraeskillTraeSkills打造最强黑科技—Github秒变私有Skill库 | Skill Hub 中国qoder的skill使用Skills - Qoder文档里说了qoder内置了技能可以自动创建还有通过skills cli安装的方法命令分析# 从 skills.sh 市场安装 # -a 是 --agent 的缩写它明确指定了这个技能是为 Qoder 这个智能体 npx skills add vercel-labs/agent-browser -a qoder # 从 GitHub 仓库安装指定技能 # 适用于特定仓库中的特定技能。这个仓库里包含了很多个技能必须用 --skill 参数告诉 CLI“我要安装的是这个大仓库里的这一个小技能”而不是把整个大仓库都装进去 npx skills add https://github.com/anthropics/skills --skill skill-creator -a qoderqoder中vercel-labs/agent-browser 是简写它默认指向 GitHubskill仓库full-stack-skills/docs/AGENT_SKILLS_GETTING_STARTED.md at main · partme-ai/full-stack-skills

更多文章