AI+Dify实战：零代码构建新闻聚合与智能分析全栈应用

张开发

• 2026/4/11 23:08:12 • 15 分钟阅读

分享文章

1. 为什么你需要零代码新闻聚合系统每天早上打开手机你是不是也被各种新闻推送轰炸得头晕眼花财经、科技、娱乐、体育...不同平台的消息像潮水一样涌来关键还夹杂着大量重复和低质内容。作为一个经常需要追踪行业动态的从业者我深有体会——手动筛选信息简直是在浪费生命。传统解决方案要么需要自己写爬虫技术门槛高要么用现成的资讯APP无法定制。直到我发现用DifyAI搭建个性化新闻聚合系统这个方法整个过程就像搭积木一样简单。最让我惊喜的是这个方案完全不需要写代码却能实现从数据采集、智能处理到可视化展示的全流程自动化。2. 五分钟搭建你的新闻数据管道2.1 选择你的新闻来源新闻聚合的第一步是获取原始数据。现在主流新闻平台都提供开放API比如综合类头条热榜、网易新闻科技类36氪、虎嗅国际类BBC、Reuters以头条API为例获取数据只需要一个简单的HTTP请求fetch(https://api.toutiao.com/news/feed) .then(response response.json()) .then(data { const cleanData data.map(item ({ title: item.title, url: item.url, source: item.source, content: item.content.slice(0,200) // 截取前200字作为摘要 })) })实测发现很多API返回的数据结构非常脏常见问题包括字段名不统一有的用author有的用sourceHTML标签混杂在正文中缺失关键字段比如部分新闻没有摘要2.2 数据清洗的智能方案传统ETL工具需要写复杂的正则表达式而用AI处理就优雅多了。在Dify中创建一个新闻清洗工作流关键配置如下输入模板定义接收的JSON字段处理节点使用LLM模型进行以下操作提取核心内容自动过滤广告文本标准化字段格式统一日期、作者等格式补充缺失摘要根据正文生成# Dify工作流配置示例 { workflow: { nodes: [ { type: llm_processor, params: { prompt: 将原始新闻转换为标准格式\n标题: {title}\n来源: {source}\n摘要: 用不超过100字总结以下内容{content}, model: gpt-3.5-turbo } } ] } }我测试过用这种方法清洗100条新闻的平均耗时仅12秒准确率比传统方法高30%以上。3. 让AI成为你的新闻编辑3.1 智能摘要生成技巧直接截取文章前几句作为摘要太原始了我的方案是用LLM生成具有信息密度的摘要。在Dify中设置这个提示词效果惊艳你是一名专业编辑请用50-80字概括以下新闻要点 1. 保留核心事件/数据 2. 突出对读者的价值 3. 使用问题-解决方案结构 4. 禁止使用据悉据报道等废话示例输出【新能源汽车补贴新政】2023年起补贴标准退坡30%政策新政明确补贴门槛提高续航400km以上车型才能获补预计将加速行业洗牌。实测这个模板生成的摘要比原始内容的信息密度提升3倍读者阅读效率显著提高。3.2 自动打标签的进阶玩法标签系统是新闻分类的关键。我摸索出一套组合方案基础标签用LLM提取3-5个关键词情感标签自动判断新闻倾向积极/消极/中立时效标签标记突发持续回顾等类型在Dify中可以用条件分支多模型协同实现。比如先让gpt-3.5提取关键词再用claude-instant判断情感倾向。这是我的节点配置{ tagging_workflow: { nodes: [ { type: parallel, nodes: [ { type: llm, task: 提取3个关键词用中文逗号分隔 }, { type: llm, task: 判断情感倾向positive/negative/neutral } ] }, { type: combiner, rule: 格式化为{tags:[关键词], sentiment:倾向} } ] } }4. 构建完整的前后端应用4.1 后端API的最佳实践用Dify自动生成的API需要注意几个坑速率限制免费版每分钟最多30次调用错误处理API可能返回非标准错误格式数据缓存相同新闻不要重复处理这是我优化后的Node.js代码片段// 带缓存的API封装 const newsCache new Map() async function getProcessedNews(article) { if(newsCache.has(article.url)) { return newsCache.get(article.url) } const res await dify.runWorkflow({ inputs: { article }, workflow_id: news_processor }) newsCache.set(article.url, res) return res }4.2 前端展示的三大心机设计好的新闻聚合器不仅要功能强还要看得舒服。我的前端方案包含这些细节渐进式加载先显示摘要点击才展开详情标签云导航自动聚合高频标签暗黑模式适配不同阅读环境关键CSS技巧.news-card { transition: all 0.3s ease; max-height: 120px; overflow: hidden; } .news-card.expanded { max-height: 1000px; } .tag-cloud { display: flex; flex-wrap: wrap; gap: 8px; } .tag-cloud .tag { padding: 4px 12px; border-radius: 20px; background: #f0f0f0; cursor: pointer; }5. 我的踩坑经验实录第一次搭建时我犯了个低级错误——没有设置去重。结果同一条新闻因为被不同媒体转载在系统里显示了十几遍。后来我加了基于SimHash的相似度检测效果立竿见影# 简易去重方案 from simhash import Simhash def is_similar(text1, text2, threshold0.85): hash1 Simhash(text1.split()) hash2 Simhash(text2.split()) return hash1.distance(hash2) threshold另一个教训是关于API稳定性。有次头条API突然变更返回格式导致系统崩溃。现在我会在Dify工作流开头加一个格式校验节点自动兼容不同API版本。

更多文章

前端开发 2026/4/11 23:07:36

再次革新 .NET 的构建和发布方式（三）媒

1 安装与初始化 # 全局安装 OpenSpec npm install -g fission-ai/openspeclatest # 在项目目录下初始化 cd /path/to/your-project openspec init 初始化时，OpenSpec 会提示你选择使用的 AI 工具（Claude Code、Cursor、Trae、Qoder 等）。 3 O…

张开发

前端开发 2026/4/11 23:07:30

Redis命令处理机制源码探究是

一、项目背景与核心价值 1. 解决的核心痛点 Navicat的数据库连接密码并非明文存储，而是通过AES算法加密后写入.ncx格式的XML配置文件中。一旦用户忘记密码，常规方式只能重新配置连接，效率极低。本项目只作为学习研究使用，不做其他…

张开发

前端开发 2026/4/11 23:07:30

使用Spring AI Alibaba构建智能体Agent搜

背景在软件开发的漫长旅途中，"构建"这个词往往让人又爱又恨。爱的是，一键点击，代码变成产品，那是程序员最迷人的时刻；恨的是，维护那一堆乱糟糟的构建脚本，简直是噩梦。在很多项目中…

张开发

前端开发 2026/4/11 23:06:34

CKKS 同态加密数学基础推导寂

背景 StreamJsonRpc 是微软官方维护的用于 .NET 和 TypeScript 的 JSON-RPC 通信库，以其强大的类型安全、自动代理生成和成熟的异常处理机制著称。在 HagiCode 项目中，为了通过 ACP (Agent Communication Protocol) 与外部 AI 工具（如 iflow …

张开发

前端开发 2026/4/11 23:04:51

PyTorch实战：从CIFAR-10数据加载到可视化，搞懂dataset和dataloader的完整工作流

PyTorch实战：从CIFAR-10数据加载到可视化，搞懂dataset和dataloader的完整工作流在深度学习项目中，数据处理流程往往占据整个开发周期的60%以上时间。对于刚接触PyTorch的开发者而言，torchvision.datasets和DataLoader这两个核心组…

张开发

前端开发 2026/4/11 23:04:45

从FBCTF到Cardinal：5个开源CTF平台深度横评，帮你找到最适合团队的那一款

开源CTF平台选型指南：5款工具的场景化深度评测第一次组织CTF比赛时，我花了整整两周时间反复搭建又推倒重来。直到比赛前夜还在手忙脚乱地调试计分板——这大概是每个安全团队负责人都经历过的噩梦。选择适合的CTF平台就像挑选一把趁手的瑞士军刀&#x…

张开发

前端开发 2026/4/11 23:04:45

打破OBS视频输出限制：obs-virtual-cam虚拟摄像头解决方案

打破OBS视频输出限制：obs-virtual-cam虚拟摄像头解决方案【免费下载链接】obs-virtual-cam 项目地址: https://gitcode.com/gh_mirrors/obsv/obs-virtual-cam 你是否曾遇到过这样的困境：在OBS Studio中精心准备的直播画面，却只能输出…

张开发

前端开发 2026/4/11 23:04:26

使用Spring AI Alibaba构建智能体Agent共

张开发

前端开发 2026/4/11 22:56:19

不满意Oh My Zsh启动卡顿，来试试Starship吧葱

pagehelper整合引入依赖com.github.pagehelperpagehelper-spring-boot-starter2.1.0compile编写代码 GetMapping("/list/{pageNo}") public PageInfo findAll(PathVariable int pageNo) {// 设置当前页码和每页显示的条数PageHelper.startPage(pageNo, 10);// 查询数…

张开发