2026年1月23日

从后端到全栈卢米用三天 Vibe Coding 打造新闻联播 Agent

卢米同学

独立开发者 / 项目作者

在 AI 浪潮下，开发者的能力边界正在被重塑。今天我们要介绍的开发者是卢米同学，一位坐标深圳的后端工程师。在大厂与创业公司摸爬滚打多年后，他选择利用业余时间，通过 AI 辅助打破技术栈的隔离，走上独立开发的道路。

他近期上线的作品是一个垂直领域的 AI Agent，专门用于分析《新闻联播》的数据内容。这个项目不仅是一个技术练手作，更是一次关于个人开发者如何在巨头林立的 AI 时代找到生态位的精彩实验。

为什么选择最硬的新闻？

当大多数开发者还在套壳通用大模型时，卢米把目光投向了极度垂直的领域。

“通用型 Agent 是大公司的战场，个人开发者更适合去挖掘那些被忽视的垂直场景。”卢米这样解释他的选品逻辑。他选择了《新闻联播》这个全中国信息密度最高、政策信号最强的官方信源。市面上缺乏专门针对这一数据源的 AI 产品，而考公群体、投资者和政策研究者对此有着刚性需求。

通过这个切口，他避开了与 GPT、Claude 等通用模型的直接竞争，转而提供可靠、有据可查的深度分析服务。

三天Vibe Coding：后端也能搞定全栈

这个项目的诞生过程极具代表性——它是典型的 Vibe Coding（氛围编程）产物。

作为一名后端工程师，卢米利用三个晚上的熬夜时间，完成了从数据采集、RAG 构建到前端 Next.js 搭建的全过程。他没有选择当下流行的 Cursor 或 Claude Code，而是使用了一款名为 Droid 的命令行 AI 工具。对他而言，这种纯粹的 CLI 交互方式不仅让 Token 用量一目了然，也更符合资深开发者的掌控欲。

“AI 最大的价值，是大幅降低了实践的门槛。”卢米坦言。借助 AI，他补齐了前端短板，以极低的成本跑通了 Next.js 的开发流程，实现了从纯后端向全栈开发者的跨越。

技术护城河：混合搜索与数据清洗

虽然是 MVP（最小可行性产品），但卢米并没有在技术深度上妥协。在构建 RAG（检索增强生成）时，他发现单纯的语义搜索召回率并不理想。

为了解决这个问题，他设计了一套混合搜索策略：将向量语义搜索与传统的关键词匹配相结合，Agent 会根据用户的问题类型自动选择最优的搜索方式。同时，针对《新闻联播》特殊的语言风格，他通过反复调优 Prompt，引导 AI 优先使用本地清洗好的知识库，而非通过联网胡乱搜索。

这种对数据质量和搜索精度的死磕，构成了这款小产品的核心竞争力。

给开发者的思考：先跑起来，再谈变现

对于盈利，卢米表现得非常克制。目前的架构成本极低：99元一年的阿里云服务器加上免费的 Vercel 部署。他没有急于接入支付系统，而是选择先免费开放，验证核心价值。

“先跑通 MVP，看用户反馈再定方向。”这是他对其他开发者的建议。无论是未来可能的数据订阅、API 输出，还是小程序化，都要建立在产品真正解决了问题的基础之上。

卢米的故事向我们证明了：在 AI 时代，技术栈不再是限制想象力的枷锁。只要找准一个垂直切口，利用好手中的 AI 工具，每一个开发者都能在几天之内，把一个模糊的灵感变成触手可及的产品。

我邀请了卢米进行视频对谈，深入交流独立开发的技术细节与心路历程。我们将讨论如何在职场工作与个人项目之间找到平衡，以及挖掘垂直需求的具体方法。欢迎预约视频号直播，参与我们的实时讨论。

0、可以快速介绍以下自己吗？

大家好，我是卢米同学，后端工程师，坐标深圳。职业经历上，大厂、中厂、小厂都待过，趁年轻多尝试不同的环境。在大厂期间接触过大数据、算法和后端开发，这些经历为后来做全栈开发打下了基础。 AI 时代的到来大幅降低了学习和实践的门槛，我想趁这个窗口期做点东西出来。未来更倾向于走独立开发这条路，不仅是做副业，也是为了提升职场上的抗风险能力。

1、能简单介绍一下你的项目和核心功能吗？

这是一个垂直领域的 AI Agent，核心特点是整合了央视新闻联播的数据内容，每日自动更新，并构建了混合搜索的知识库。用户可以通过对话的方式，获取可靠、准确、有据可查的分析结果。我觉得垂直领域的 Agent 有很大的市场空间，通用型 Agent 留给大公司去做，个人开发者更适合去挖掘那些被忽视的垂直场景。

2、这个项目是如何起步的？背后有什么灵感？

延续上面的思路，我想找一个垂直领域来实践 AI Agent。新闻联播是中国最权威的官方新闻发布平台，信息密度高、政策信号强，但市面上并没有专门针对这个数据源的 AI 产品，所以就从这里切入了。

3、初期遇到过哪些挑战？是如何解决的？

主要有几个方面：

方向选择：初期花了不少时间思考到底要做什么，最终锁定了新闻联播这个垂直场景。
数据采集：需要从 CCTV 官网抓取数据，涉及爬虫稳定性、反爬策略和数据清洗。最终采用 httpx + selectolax 实现异步爬虫，配合随机延迟来规避封禁。
搜索召回优化：单纯的语义搜索召回率不够理想。最终设计了混合搜索策略，将语义搜索与关键词匹配结合，根据查询类型自动选择搜索方式。
Prompt 工程：需要让 Agent 理解新闻联播的语言风格（官方表述与日常用语的差异），同时引导它优先使用本地知识库，而非直接联网搜索。这部分反复调优了很多次。
服务器网络环境：在 Linux 服务器上部署时，拉取依赖包和调用境外 API（如 OpenRouter）经常超时。借助 AI 辅助，完成了网络链路的优化配置，这个过程收获很大。

4、你是如何盈利化这个项目的？有哪些方式？

坦白说，目前还没有认真考虑盈利，这块不是我的强项。初步想法是采用积分制：对话消耗积分，用户通过购买积分付费。但支付对接还需要踩一些坑，所以现阶段先免费开放，初期愿意投入一点成本来验证产品。变现方向其实有很多可能性：比如做自媒体社群、对外提供 MCP/API 能力、或者接入广告等。但这些目前都停留在初步构想阶段，产品还太早期，先把核心价值跑通再说。

5、你的项目面向哪些用户？如何吸引他们？

目标用户是关注国家政策的人群，比如考公群体、政策研究者、投资者，或者任何对时政感兴趣的人。AI Agent 的对话形式给用户很大的探索空间——比如可以问「最近半年新闻联播提到人工智能多少次」「某项政策的报道频次变化趋势」等。增长策略方面，还在摸索中。

6、项目未来的发展方向是什么？

目前是 MVP 阶段，先跑起来，看用户反馈再定方向。未来可能的路径：一是扩展数据源或增加分析维度；二是考虑依托各大平台做小程序、APP 等产品形态，触达更广泛的用户群体。但现在还没找到明确的需求切入点，不急于扩张，先把核心体验打磨好。

7、作为独立开发者，你如何保持动力和创新？

动力主要来自解决真实需求带来的成就感。目前我还在上班，这个项目是利用三天晚上熬夜，以 vibe coding 的方式做出来的。开发过程中尝试了多款 AI 辅助工具，包括 Cursor、Claude Code、Codex 等，最后用得最顺手的是 Droid。可能因人而异，我比较喜欢命令行这种纯粹的交互方式，而且 token 用量一目了然，心里有数。

8、有哪些独特的功能让你的项目脱颖而出？

数据层面：市面上没有专门做新闻联播数据的 AI Agent，这是核心差异点。技术层面：

混合搜索策略：结合向量语义搜索与关键词精确匹配，Agent 根据问题类型自动选择最优搜索方式
多维度分析：支持政策信号解读、报道频次统计、措辞变化追踪、行业影响分析等
数据时效性：周期性的数据采集保证数据实效性
流式对话：基于 LangGraph 实现流式输出，提升交互体验

9、项目发展过程中，社群和合作有多大帮助？

群里讨论氛围很好，受益于群主的「干中学搞垃圾」微信群，能看到其他独立开发者的实战经验和思考方式，对我启发很大。

10、在项目中，你有哪些收获或成长？

完整实践了 RAG 流程：数据采集 → 向量化 → 混合搜索 → Agent 输出
LangChain/LangGraph 是我持续关注的技术栈，这次终于落地到实际项目
前端能力有所提升，之前专注后端，这次用 Next.js 从零搭建了前端工程层面：
跑通了网站从开发到部署上线的完整流程
意识到 token 成本是核心风险点，后续需要平衡 token 消耗与用户付费的关系当前阶段的重点是收集用户反馈，持续迭代。

原文链接：https://mp.weixin.qq.com/s?__biz=MzA3OTIwOTcyMQ==&mid=2247485614&idx=1&sn=97c9b5fc5f4dbf1a4be1b20a8c4f9800&chksm=9fb7bd38a8c0342e00b3a1cb43244eb0d0c1517e7ee157ee326f17dc5a0658d3d60c5ebf4579