干中学·AI 项目实战社群用 AI 做出你的第一个真实项目
导航
2026年1月23日

从后端到全栈 卢米用三天 Vibe Coding 打造新闻联播 Agent

卢米同学

独立开发者 / 项目作者

在 AI 浪潮下,开发者的能力边界正在被重塑。今天我们要介绍的开发者是卢米同学,一位坐标深圳的后端工程师。在大厂与创业公司摸爬滚打多年后,他选择利用业余时间,通过 AI 辅助打破技术栈的隔离,走上独立开发的道路。

他近期上线的作品是一个垂直领域的 AI Agent,专门用于分析《新闻联播》的数据内容。这个项目不仅是一个技术练手作,更是一次关于个人开发者如何在巨头林立的 AI 时代找到生态位的精彩实验。

项目地址:https://www.lumina-core.cn/

为什么选择最硬的新闻?

当大多数开发者还在套壳通用大模型时,卢米把目光投向了极度垂直的领域。

“通用型 Agent 是大公司的战场,个人开发者更适合去挖掘那些被忽视的垂直场景。”卢米这样解释他的选品逻辑。他选择了《新闻联播》这个全中国信息密度最高、政策信号最强的官方信源。市面上缺乏专门针对这一数据源的 AI 产品,而考公群体、投资者和政策研究者对此有着刚性需求。

通过这个切口,他避开了与 GPT、Claude 等通用模型的直接竞争,转而提供可靠、有据可查的深度分析服务。

三天Vibe Coding:后端也能搞定全栈

这个项目的诞生过程极具代表性——它是典型的 Vibe Coding(氛围编程) 产物。

作为一名后端工程师,卢米利用三个晚上的熬夜时间,完成了从数据采集、RAG 构建到前端 Next.js 搭建的全过程。他没有选择当下流行的 Cursor 或 Claude Code,而是使用了一款名为 Droid 的命令行 AI 工具。对他而言,这种纯粹的 CLI 交互方式不仅让 Token 用量一目了然,也更符合资深开发者的掌控欲。

“AI 最大的价值,是大幅降低了实践的门槛。”卢米坦言。借助 AI,他补齐了前端短板,以极低的成本跑通了 Next.js 的开发流程,实现了从纯后端向全栈开发者的跨越。

技术护城河:混合搜索与数据清洗

虽然是 MVP(最小可行性产品),但卢米并没有在技术深度上妥协。在构建 RAG(检索增强生成)时,他发现单纯的语义搜索召回率并不理想。

为了解决这个问题,他设计了一套混合搜索策略:将向量语义搜索与传统的关键词匹配相结合,Agent 会根据用户的问题类型自动选择最优的搜索方式。同时,针对《新闻联播》特殊的语言风格,他通过反复调优 Prompt,引导 AI 优先使用本地清洗好的知识库,而非通过联网胡乱搜索。

这种对数据质量和搜索精度的死磕,构成了这款小产品的核心竞争力。

给开发者的思考:先跑起来,再谈变现

对于盈利,卢米表现得非常克制。目前的架构成本极低:99元一年的阿里云服务器加上免费的 Vercel 部署。他没有急于接入支付系统,而是选择先免费开放,验证核心价值。

“先跑通 MVP,看用户反馈再定方向。”这是他对其他开发者的建议。无论是未来可能的数据订阅、API 输出,还是小程序化,都要建立在产品真正解决了问题的基础之上。

卢米的故事向我们证明了:在 AI 时代,技术栈不再是限制想象力的枷锁。只要找准一个垂直切口,利用好手中的 AI 工具,每一个开发者都能在几天之内,把一个模糊的灵感变成触手可及的产品。

我邀请了卢米进行视频对谈,深入交流独立开发的技术细节与心路历程。我们将讨论如何在职场工作与个人项目之间找到平衡,以及挖掘垂直需求的具体方法。欢迎预约视频号直播,参与我们的实时讨论。

0、可以快速介绍以下自己吗?

大家好,我是卢米同学,后端工程师,坐标深圳。 职业经历上,大厂、中厂、小厂都待过,趁年轻多尝试不同的环境。在大厂期间接触过大数据、算法和后端开发,这些经历为后来做全栈开发打下了基础。 AI 时代的到来大幅降低了学习和实践的门槛,我想趁这个窗口期做点东西出来。未来更倾向于走独立开发这条路,不仅是做副业,也是为了提升职场上的抗风险能力。

1、能简单介绍一下你的项目和核心功能吗?

这是一个垂直领域的 AI Agent,核心特点是整合了央视新闻联播的数据内容,每日自动更新,并构建了混合搜索的知识库。用户可以通过对话的方式,获取可靠、准确、有据可查的分析结果。 我觉得垂直领域的 Agent 有很大的市场空间,通用型 Agent 留给大公司去做,个人开发者更适合去挖掘那些被忽视的垂直场景。

2、这个项目是如何起步的?背后有什么灵感?

延续上面的思路,我想找一个垂直领域来实践 AI Agent。新闻联播是中国最权威的官方新闻发布平台,信息密度高、政策信号强,但市面上并没有专门针对这个数据源的 AI 产品,所以就从这里切入了。

3、初期遇到过哪些挑战?是如何解决的?

主要有几个方面:

  • 方向选择:初期花了不少时间思考到底要做什么,最终锁定了新闻联播这个垂直场景。

  • 数据采集:需要从 CCTV 官网抓取数据,涉及爬虫稳定性、反爬策略和数据清洗。最终采用 httpx + selectolax 实现异步爬虫,配合随机延迟来规避封禁。

  • 搜索召回优化:单纯的语义搜索召回率不够理想。最终设计了混合搜索策略,将语义搜索与关键词匹配结合,根据查询类型自动选择搜索方式。

  • Prompt 工程:需要让 Agent 理解新闻联播的语言风格(官方表述与日常用语的差异),同时引导它优先使用本地知识库,而非直接联网搜索。这部分反复调优了很多次。

  • 服务器网络环境:在 Linux 服务器上部署时,拉取依赖包和调用境外 API(如 OpenRouter)经常超时。借助 AI 辅助,完成了网络链路的优化配置,这个过程收获很大。

4、你是如何盈利化这个项目的?有哪些方式?

坦白说,目前还没有认真考虑盈利,这块不是我的强项。初步想法是采用积分制:对话消耗积分,用户通过购买积分付费。但支付对接还需要踩一些坑,所以现阶段先免费开放,初期愿意投入一点成本来验证产品。 变现方向其实有很多可能性:比如做自媒体社群、对外提供 MCP/API 能力、或者接入广告等。但这些目前都停留在初步构想阶段,产品还太早期,先把核心价值跑通再说。

5、你的项目面向哪些用户?如何吸引他们?

目标用户是关注国家政策的人群,比如考公群体、政策研究者、投资者,或者任何对时政感兴趣的人。AI Agent 的对话形式给用户很大的探索空间——比如可以问「最近半年新闻联播提到人工智能多少次」「某项政策的报道频次变化趋势」等。 增长策略方面,还在摸索中。

6、项目未来的发展方向是什么?

目前是 MVP 阶段,先跑起来,看用户反馈再定方向。 未来可能的路径:一是扩展数据源或增加分析维度;二是考虑依托各大平台做小程序、APP 等产品形态,触达更广泛的用户群体。但现在还没找到明确的需求切入点,不急于扩张,先把核心体验打磨好。

7、作为独立开发者,你如何保持动力和创新?

动力主要来自解决真实需求带来的成就感。目前我还在上班,这个项目是利用三天晚上熬夜,以 vibe coding 的方式做出来的。 开发过程中尝试了多款 AI 辅助工具,包括 Cursor、Claude Code、Codex 等,最后用得最顺手的是 Droid。可能因人而异,我比较喜欢命令行这种纯粹的交互方式,而且 token 用量一目了然,心里有数。

8、有哪些独特的功能让你的项目脱颖而出?

数据层面:市面上没有专门做新闻联播数据的 AI Agent,这是核心差异点。 技术层面:

  • 混合搜索策略:结合向量语义搜索与关键词精确匹配,Agent 根据问题类型自动选择最优搜索方式

  • 多维度分析:支持政策信号解读、报道频次统计、措辞变化追踪、行业影响分析等

  • 数据时效性:周期性的数据采集保证数据实效性

  • 流式对话:基于 LangGraph 实现流式输出,提升交互体验

9、项目发展过程中,社群和合作有多大帮助?

群里讨论氛围很好,受益于群主的「干中学搞垃圾」微信群,能看到其他独立开发者的实战经验和思考方式,对我启发很大。

10、在项目中,你有哪些收获或成长?

  • 完整实践了 RAG 流程:数据采集 → 向量化 → 混合搜索 → Agent 输出

  • LangChain/LangGraph 是我持续关注的技术栈,这次终于落地到实际项目

  • 前端能力有所提升,之前专注后端,这次用 Next.js 从零搭建了前端 工程层面:

  • 跑通了网站从开发到部署上线的完整流程

  • 意识到 token 成本是核心风险点,后续需要平衡 token 消耗与用户付费的关系 当前阶段的重点是收集用户反馈,持续迭代。


原文链接:https://mp.weixin.qq.com/s?__biz=MzA3OTIwOTcyMQ==&mid=2247485614&idx=1&sn=97c9b5fc5f4dbf1a4be1b20a8c4f9800&chksm=9fb7bd38a8c0342e00b3a1cb43244eb0d0c1517e7ee157ee326f17dc5a0658d3d60c5ebf4579

免费社群

加入免费社群

扫码添加我的联系方式,我会拉你进入免费群。这里和知识星球分开,适合先看看日常交流氛围。

独立开发日常交流AI 使用技巧互相分享项目推进中的吐槽和反馈

二维码可以点击放大。微信扫码后,备注「免费社群」会更容易确认。