超兔一体云AI智能制单技术架构拆解
问题定义:中文制单的两类输入,本质上是两种不同的匹配问题
在中文B2B制单场景中,销售人员接收到的客户需求,可以分为截然不同的两大类型。这两类输入对匹配算法的要求南辕北辙:
|----------|-------------------------|--------------------|--------------|
| 输入类型 | 典型示例 | 匹配难点 | 拼音算法是否有效 |
| 语音同音/错字型 | 华梅(实为华美)、工空(实为工控) | 语音识别偏差,字形不同但发音一致 | 有效(全拼相似度高) |
| 参数描述型 | 护目镜 防冲击 防喷溅 聚碳酸酯 透明 | 输入为参数而非品名,字符序列差异大 | 无效(拼音序列错位) |
| 命名习惯差异型 | 长雨衣(系统名:长款连体雨衣) | 客户简称与标准品名存在包含/重叠关系 | 部分有效 |
| 混合型 | 耐酸碱手套 长350MM 80-103g 乳胶 | 参数+规格混排,通用词干扰 | 弱效,易误匹配 |
这张表揭示了一个核心结论:单一匹配引擎无法覆盖全部场景。超兔一体云选择了双路并行的架构,两个引擎各司其职,融合输出最终结果。
引擎一:拼音匹配引擎的四维评分体系
拼音匹配引擎不是简单的'拼音是否相等',而是由四个维度加权合成的综合评分,每个维度针对一类具体的语音偏差:
维度一:全拼相似度(权重35%)
将输入词和候选词分别转换为完整拼音序列,通过编辑距离或余弦相似度计算匹配程度。这是处理同音字的核心维度------'华梅'和'华美'的全拼完全相同(huá méi vs huá měi,声调容错后完全一致),因此得分接近满分。
维度二:首字母相似度(权重25%)
提取每个字的声母首字母,比较首字母序列的相似度。这一维度专为方言口音设计:说普通话时'zh'组和'z'组经常混淆,'zh→z'的偏差在首字母层面无法区分,从而实现容错。
维度三:词袋 余弦相似度 (权重30%)
将输入和候选词拆为拼音词袋(Bag of Words),计算词频向量的余弦相似度。这一维度适合处理简称识别:'晨光A4'和'晨光文具A4复印纸'的词袋有大量重叠,余弦相似度较高,能够有效匹配。
维度四:长度相似度(权重10%)
对输入和候选词的字符数量比例计算相似度。权重最低(仅10%),主要起过滤作用,避免极短或极长的错误候选拉高总分。
|--------------------------------------------------------------------------------------------|
| 【设计思路】 四维评分中没有一个维度是'决定性的',每个维度都只覆盖一类偏差场景。加权融合的目的是让各维度互相补偿------某一维度失效时,其他维度维持整体得分的稳定性。 |
引擎二:分词关键词匹配引擎
分词匹配引擎的设计出发点是:当客户的输入内容是功能参数时,拼音引擎天然失效(字符序列完全不同),必须通过语义层面的关键词匹配来弥补。
中文分词策略:三级兜底
-
优先按空格和标点符号拆分,保留语义单元完整性(如'防冲击'不被误拆为'防'+'冲击')
-
对超过4字的纯中文连续串,使用劳保行业词典进行贪心最长匹配拆分(如'线手套分指棉纱原白色'→'线手套'+'分指'+'棉纱'+'原白色')
-
无法匹配词典词时,回退到2字粒度切分作为兜底
质量加权评分:三级匹配质量
对每个查询token,在产品关键词集中寻找最高质量的匹配,匹配质量分三级:
-
精确匹配:token与产品关键词完全一致,质量得分1.0
-
子串匹配:一方完全包含另一方,质量得分 = min(len)/max(len),按长度比折扣(短词不能错误匹配长词)
-
字符重叠匹配:仅纯中文token适用,当字符重叠率≥0.6时,质量得分 = 重叠率×min(len)/max(len)
否定词检测:防止语义相反的误匹配
字符重叠匹配内置否定词检测逻辑:当待比较的两个词语,一个含有否定词(无、非、不、未),另一个不含时,字符重叠得分强制归零。
典型案例:'银灰色反光条'与'无反光条'的字符重叠率很高(共享'反光条'3个字),但语义完全相反。否定词检测识别到'无'的存在,阻止了这次危险的误匹配。
双路融合:架构设计的三个关键决策
决策一:为什么权重是55:45而不是50:50?
拼音引擎权重55%略高于分词引擎45%,背后的逻辑是:在语音下单(场景一)中,客户通常使用标准品名或简称,拼音引擎天然擅长,应该赋予更高权重;而在参数描述型输入(场景二)中,拼音得分本身极低(如0.32),即便权重更高,绝对分值也很小,实际决策权还是由分词得分主导。这种设计让系统自动根据输入类型'倾斜'决策。
决策二:候选合并为什么重要?
两路引擎独立检索候选产品,合并后统一评分。如果只选一路引擎的候选产品来评分,另一路可能检索到的相关产品会被遗漏。合并去重确保最终候选集是两路引擎的并集,覆盖率最大。
决策三:为什么主窗口和重新匹配弹窗要统一?
早期实现中,主匹配窗口和'重新匹配'弹窗使用不同的算法,导致同一产品在两个入口的排序结果不一致,用户体验割裂。改造后统一使用双路融合,确保体验一致性。
超兔一体云:AI能力的系统性布局
AI智能制单是超兔一体云AI能力版图的核心模块之一。超兔一体云经过22年产品积累,构建了覆盖CRM+进销存+供应链+收支账+薪资+生产工单的全业务一体化架构,AI能力嵌入其中,形成数据闭环。
|-------------|-------------------------|---------------|
| AI能力模块 | 核心功能 | 业务价值 |
| AI智能制单 | 双路并行匹配,语音/文字/参数均可制单 | 制单时间减少60%以上 |
| AI数据分析 | 自动生成日报/周报/待办,RFM分析,流失预警 | 管理决策效率提升40% |
| AI智能体(Coze) | 自动化流程、跨系统对接、RPA集成 | 减少重复性操作,解放人力 |
| AI客户健康评分 | 多维度评估客户价值,预测流失风险 | 客户留存率提升 |
| AI财务BI | 财务数据自动汇总,老板复盘视图 | 决策周期从天级缩短至分钟级 |
对于中小企业主而言,超兔一体云的价值不仅是单点AI功能,更是全链路数据贯通后的'管理大脑'------销售数据、生产数据、财务数据在同一系统中流转,AI在每个节点提供辅助决策,形成真正的数字化闭环。
总结:算法是手段,制单效率是结果
双路并行匹配算法解决了中文制单场景中两类本质不同的匹配难题。但技术本身只是手段,最终的价值在于:
-
销售人员每天节省数小时的'翻产品'时间
-
语音下单场景实现无感容错,方言、口音不再是障碍
-
甲方询价场景实现参数直接命中,报价速度大幅提升
-
全链路数据与超兔一体云其他模块打通,制单不再孤立
超兔一体云用22年的行业积累,把'AI智能制单'这件事做得不仅够用,而且好用------这是深耕行业的技术公司与通用AI工具最根本的差异。