分享：实际业务里 work 的AI Agent客服系统（一）

在经历了三四轮失败后，我跑通了一套以 Agent 为核心、人工为辅助的进化系统。它的核心不在于初始配置有多牛，而在于一套“反馈-纠正-固化”的闭环评估机制，让 AI 能够在实战中不断“吃一堑长一智”。

过去一年的探索：从失败到真正 Work

过去一周我一直在开发自己的客服系统。这套系统以 Agent 为核心来解决问题，人工只是辅助。已经在实际业务场景里跑通了。目前看下来还是不错的。

其实用 AI 来解决客服问题，我从去年上半年就已经开始尝试。经过三四轮的尝试，之前都失败了。到了 26 年，它已经成功了，并且门槛并不高。

它是一个在实际业务场景中可以 Work 的系统。得益于大模型和 Agent 系统形态的发展，现在这套系统已经可以在实际业务场景里面运行了。

今天就讨论一下：以 Agent 为核心的客服系统，它最核心的模块是什么，怎么设计。

我认为 Agent 客服系统最核心的就是解决一个问题： 怎么让这个 Agent 不断地升级，提升自己的能力，来覆盖更多的对话场景，从而减少对人力的需要。

从理论上来讲，只要准备非常完备的知识库，提供非常完备的工具，它就能覆盖更多场景。但在实际业务中，这是不可能的。

所以关键在于：如何让 Agent 在实际运行过程中不断地自我升级。

这里面最关键的是基于评估手段，通过评估来驱动系统优化，而不是把锅甩给知识库和工具。

这套方案最重要的有三个环节：

反馈环节就像写作业，正确的题不需要反馈，只有错题才需要纠正。但靠用户打分的比例太低了，可能不到 1% 的用户愿意评分。

为了获得有效反馈，我设计了三个渠道：

这是整个系统最重要的起点。

纠正环节就是把上述反馈的对话上下文全部丢进一个控制台，让人工去纠正。人工在这里要发挥巨大的作用。

我们实践下来，有两类核心信息必须明确：

除此之外，还有一些辅助选填项：

核心中的核心，依然是“分类”和“正确答案”。现在大模型的能力不断提升，我们不要去限制整个大模型处理的过程。

只通过结果给Agent做反馈，大模型自己能够找出最好的解决方案过程。

有了反馈和纠正，怎么让未来不再出现相似问题？这就是固化。

任何问题的优化最终都会落实到三个落地处： 知识库、提示词、工具调用。

但如果全靠人去优化这三项，效率太低了。现在的设计是：由 Agent 基于人工纠正的信息，每天汇总一遍优化建议给到人工审核。

最重要的一点：不能让它自动完成。 在实际业务里，AI 并不一定比人更了解业务，很可能改错。人作为最后的审核人员，确定优化后的内容才能进入生产环境。

这就是一套完整的、基于评估驱动的 Agent 自我优化系统。

它在实际业务场景中操作并不复杂，也没有过度依赖人工。它找到了 Agent 和人工之间的一个很好的平衡。

网络上有很多高大上的方案，但我认为都存在风险。

因为最真实的场景是：人是懒的，Agent 是会犯错的。

完全依赖人工纠正不靠谱，完全依赖 Agent 自动优化也不靠谱。两者有效规避风险，这套系统才能行之有效。