Product Docs

知识库结构

返回作品总览

知识库结构

设计目标

AI 客服的回答质量很大程度取决于知识库。外卖商家的知识并不复杂,但容易分散:菜单在平台页面,营业时间在店铺公告,退款规则在老板经验里,过敏和食品安全靠店员口头提醒,活动规则跟平台变化走。如果这些内容没有结构化,模型只能凭通用常识回答,既不准确也不可追踪。

知识库不是一份 Markdown 文档,而是与 RAG 检索、后台管理、看板统计、质检复盘耦合的运营资产。它需要解决三个问题:

  1. 客户问法多样时如何召回正确内容
  2. 商家如何自己维护而不依赖技术
  3. 运营如何知道哪些知识有用、哪些过期、哪些缺失

分类原则

知识库按外卖客服的真实问题分布组织,而不是按数据库表或技术模块组织。一级分类有六类:菜品与口味、价格与分量、营业与配送、订单与售后、活动与优惠、食品安全与过敏。这种分类对商家直观,也和意图分类对应。客户问「推荐什么好吃」会命中菜品与口味;问「几点关门」会命中营业与配送;问「虾不新鲜」进入订单与售后或食品安全。

每条知识包含标题、正文、同义问法、标签、状态、版本号、命中数、有用反馈和无用反馈。title 用于后台管理,content 用于 AI 回答,synonyms 用于提升关键词召回,tags 用于筛选和看板,status 控制是否参与检索,version 用于回滚和迭代。一条知识既是内容,也是运营对象。

六大分类详解

菜品与口味:招牌菜、辣度、推荐搭配、适合人数、是否可加料、菜品特点。承担导购和转化价值,回答带一点销售感但不夸张承诺。捞汁皮皮虾可说明蒜蓉和酸辣两种汁,海鲜大拼盘适合多人,但不应说「一定不会踩雷」。

价格与分量:单品价格、套餐分量、餐具、包装费、米饭和饮品。价格信息容易变化,后台显示更新时间。回答时引用范围或建议以平台页面为准,避免因价格变更造成纠纷。

营业与配送:营业时间、配送范围、夜宵高峰、预计出餐、门店地址、自取规则。高频咨询,也是最容易自动解决的内容。夜宵高峰说明尤其重要——提前告知 21 点到 23 点可能较慢,可以降低催单和差评。

订单与售后:订单查询说明、漏餐、错餐、退款、取消订单、发票、补偿边界。这一类不只写标准回答,还要明确 AI 能做什么、不能做什么。AI 可以收集订单号并建工单,但不能直接承诺退款金额。

活动与优惠:满减、优惠券、团购、会员、平台活动叠加规则。活动类知识标记有效期,过期内容会严重影响信任。回答时提醒以平台结算页为准。

食品安全与过敏:海鲜过敏、食材保存、变质投诉、儿童和孕妇谨慎、异味处理。优先级最高,不以自动解决为目标,而以风险识别和转人工为目标。知识库的作用是提供合规、谨慎、明确的提示,帮助 AI 不乱承诺。

同义词与问法

同义词是中小知识库提升召回的低成本手段。客户不会按商家标题提问,他们会说「啥好吃」「招牌是啥」「关门没」「骑手在哪」「少了一盒」「花蛤是不是坏了」。每条知识维护 3 到 10 个备用问法,覆盖口语、错别字、平台常见表达和本地化说法。相比一味增加向量检索,同义词对小店更可解释,也方便商家后台编辑。

同义词不是越多越好。过宽的同义词会造成误召回——「坏了」可能指食物变质,也可能指优惠券不能用;「慢」可能指配送慢,也可能指客服回复慢。同义词要和标签、意图分类结合,并在命中后通过质检和反馈修正。

检索策略

系统采用混合检索:关键词、trigram、ILIKE、RRF 融合,向量检索作为可开关能力保留。对于 30~80 条规模的单店知识库,关键词加同义词已能覆盖大量问题,向量检索的边际收益不高且依赖外部 embedding 服务的稳定性。RAG 的目标不是炫技,而是让回答可引用、可解释、可维护。

检索结果传给回答生成,并记录 cited_article_ids。客户侧展示引用,后台统计命中率。某条知识命中很多但无用反馈高,说明内容不清楚或召回过宽;某类问题频繁 fallback,说明缺知识或同义词不足——知识库维护因此有数据依据。

后台维护

商家后台按分类树展示知识,支持新增、编辑、归档和版本查看。商家不需要理解 RAG,只需要知道「这条内容会被 AI 用来回答客户」。编辑界面突出三件事:客户常见问法、标准回答、不能承诺的边界。例如退款知识应写清「AI 可收集信息并建工单,具体退款以人工核实为准」。

维护 SOP 建议每周复盘一次:查看低命中分类、查看无用反馈、查看 fallback 记录、查看投诉工单里的新问题,决定新增、改写或归档知识。食品安全和活动规则建议设置更短复盘周期,因为风险和时效更高。

数据指标

知识库的核心指标不是条目数量,而是命中率、有用率、fallback 率和过期率。条目过多会增加维护负担,过少会导致回答空泛。一个小店初期 30 到 80 条高质量知识足够。看板显示各分类命中次数、无用反馈、最近更新时间和 30 天零命中条目,让商家能知道该维护哪里,而不是盲目加内容。

知识库直接影响有效解决率。AI 回答引用了正确知识、客户没有同类重复追问、质检分数达标,会话才被判定为 AI 解决。知识库内容错误会导致解决率虚高或客户二次投诉,因此质量比数量更重要。

设计权衡

取舍选择理由
纯向量库 vs 关键词为主关键词 + 同义词 + 向量为可选小店知识规模小、可解释性更强
让模型直读整份知识库 vs RAG 引用RAG 引用成本与上下文噪声可控,引用可追踪
平铺标签 vs 分类树分类树商家维护需要业务视角而非技术视角

后续规划

自动知识缺口发现:从 fallback、人工回复和低质检分会话中提取候选 FAQ,让商家一键确认。知识有效期提醒:例如优惠活动到期前自动提醒更新。高风险知识审批流程:过敏和赔付规则修改需要授权。按行业模板初始化:海鲜、奶茶、烧烤、快餐各有不同默认分类和风险词。