AI 应用探索之路

接触 AI 应用开发已经有两年多的时间,虽说产出甚微,但也半主动半被动地学习了很多东西,在此记录一些宏观层面的思考。

Workflow: 有多少人工就有多少智能?

2024年春天,我到某小厂实习,最初负责维护一个生产 SEO 文章的 LLM 服务仓库。该服务的核心是通过编排一套工作流,将写作拆分为确定标题、生成大纲、补充段落三个步骤,使用 LangChainGo 调用 LLM API 进行内容生成。

这是我最初接触到的 AI 应用的形态,现在看来十分粗糙。没有自主决策,没有人机交互,仅仅是通过提示词工程来约束 LLM 的单轮输出。尽管我们可以精心编排 Workflow,来让 LLM 完成较为复杂的工作,但这似乎与期望的 AGI 相去甚远——依旧依靠大量人工来赋予 AI 智能。

Agent: LLM 的下一站

同年夏天的某日,公司 leader 让我去排查一个 Agent 原型,并建议我去系统学习这项技术,他有预感 Agent 会大火。在经过一段对当时的我来说极其痛苦的 debug 后,我把问题解决了,并对 Agent 的基本特性有了初步认识。它与 Workflow 不同,人工设置的不再是某个具体流程,而是解决一类问题的范式,例如 ReAct、Plan-and-Execute 等。

在此后的几周,我被带着在这个原型上做迭代,逐步增加了搜索工具、向量检索能力以及最简单的记忆层,让这个 Agent 更加 Agentic。在离职之前,我完成了最原始的 Agent 技术积累。

2025:在概念中随波逐流

2025年被一些人称为 Agent 元年,无论是在模型层、Agent 框架层还是应用层,不断有新事物涌出。从年初的 DeepSeek V3 发布,到年中的 Claude Code 正式版,Agent 相关的一切发展似乎都无法被阻止。

由于这一年的大部分时间忙着求职,我没有心境研究这些层出不穷的概念,只是通过流媒体来做一个粗浅的了解。直到年末的几个月,借着毕设的机会,我终于完成了 Context Engineering、MCP 等技术的实践,将这些内容融入到一个健康场景的 Agent 应用中。

Agent 革命

时至今日, Agent 发展依旧迅猛。开发者或追求更强更稳的任务执行能力,或追求更惊艳的环境交互能力。我们在构建 Agent 的同时,生活也在潜移默化中被它改变。就我而言,从 Coding 到日常办公,很多工作都被 Agent 自动化替代。虽说我无法准确预测今后 Agent 的发展,但它势必将带来生产力的变革,届时我想守住行业沉淀的私有知识、约束 Agent 行为是人的两张底牌。拥抱 Agent 并与其共同进化,会逐渐成为一种与英语相同地位的必备通用能力。


AI 应用探索之路
https://zikifaker.github.io/2026/05/10/AI-应用探索之路/
作者
zikifaker
发布于
2026年5月10日
许可协议