30 天运营复盘

复盘口径

本复盘以「源家捞汁小海鲜」作为参考实施店铺，基于系统内置的 30 天演示数据和商家基线场景，模拟一次可向面试官讲清楚的数据复盘。它不是对真实外卖平台流水的披露，而是一个可重复检查的产品样例：指标口径、工单类别、知识库变化和 Prompt 调整都与系统设计保持一致。复盘关注四个核心问题：

数据来源覆盖：会话日志、工单记录、知识库命中统计、满意度评分、LLM 自动质检结果。所有数据基于参考实施店铺的基线场景设计。

整体趋势是会话量增长、转人工与工单下降、满意度稳步提升。这组数据印证了系统的核心价值：让 AI 承担高频咨询，让人工专注高价值售后。

按 30 天累计数据，AI 自动化效果（解决率 + 满意度 + 重复追问率）最好的五类场景：

场景	占比	有效解决率	备注
营业时间咨询	14%	96%	知识库命中清晰，无需工具
招牌菜推荐	12%	88%	模型可结合 RAG + 套餐建议
订单状态查询	18%	84%	工具调用回填结构化数据
配送范围咨询	7%	91%	知识条目固定
活动优惠咨询	9%	79%	部分需要补同义词

这些场景的共同特征是：事实明确、规则稳定、不涉及金额或健康风险。系统在这些场景下能稳定承担"客服第一线"角色。

下面五类场景在 30 天内全部由人工处理或经 AI 收集信息后转人工，AI 没有越权解决：

转人工率 = 100% 不是失败，而是设计预期。这些场景如果由 AI 自动处理，反而会带来法律和声誉风险。

30 天内知识库总条目从 32 条增长到 51 条（+19）。新增分布：

改写次数：12 条（含同义词补充 7 条、内容缩短 3 条、边界声明补充 2 条）。归档次数：3 条（过期活动 2 条、被新版替代 1 条）。

变化最大的是配送高峰解释——客户在 21-23 点频繁问"为什么我的订单还没到"，原本无对应知识条目，现在拆成 5 条不同问法的知识，命中率从 0 提升到 81%。

30 天内 Prompt 经历了 2 次小迭代（不算大版本切换）：

时间	改动	数据效果
第 8 天	缩短订单查询回复模板（从 80 字到 50 字）	dim_concise 从 4.1 → 4.4
第 19 天	强化过敏问题优先级（关键词命中即刻转人工）	过敏类自动转人工率从 87% → 100%

两次迭代都没有大改 Prompt 结构，而是精确修补具体边界。这种"小步快跑"的迭代节奏比"每月大改"更可控、可回滚。

工单不只是处理客户问题，也是经营改进的信号源。30 天工单类别分布暴露的运营问题：

这些信号经商家后台「自动洞察」每周汇总（参见 06-data/03-dashboard-design），变成可执行的运营建议。例如：

💡 本周 Top 工单是"漏餐"（12 单，占 36%），主要发生在 19-21 点。建议：晚餐高峰增加出餐核对环节，或在打包袋上贴菜单清单。

30 天满意度均分 4.4，分布：

低分（≤2）会话全部进入 LLM 质检（参见 06-data/04-quality-eval）。30 天复盘发现：

30 天质检均分（采样 1,200 会话）：

dim_resolution 最低（3.9），主要原因是部分会话 AI 给出回答但客户继续追问。这个维度的改进方向是优化知识库 chunking + Prompt 引用约束，让 AI 一次性给出完整信息。

按数据指向的优先级：

P0 不是 AI 改进，是业务流程改进——这恰恰说明系统已经把改进重心从 AI 转移到了运营本身。

30 天运营数据印证了一个核心判断：AI 客服系统的价值，不在于"AI 多智能"，而在于"AI 在合适的边界内做合适的事，并把不合适的事及时交给人"。

下一阶段，系统应该把"看板洞察 → 商家 SOP"这条链路打通，让自动洞察不仅是数据展示，而是可执行的运营建议。这条链路打通后，AI 客服才真正从"自动回复工具"升级为"运营改进副驾"。