二次训练中文 NLU小体积[AI人工智能(五十九)]—东方仙盟

一、先给结论(JS 可行性)

  • 华为 NLU 底层:BERT/ERNIE(Transformer Encoder)
  • JS 能跑的前提:必须是轻量版 + 量化 + ONNX
  • 700M + 原版:浏览器直接卡死,必须换小模型

二、JS 可运行、可二次训练的中文 NLU 模型

1. 首选:轻量 BERT/ERNIE(同华为架构,JS 直接跑)

2. 超轻量 NLU(纯 JS,几 MB,最快)

  • Hermes NLU (纯 JS,<10MB,意图 + 槽位)https://github.com/chez-mito/hermes-nlu

    • 完全 JS 原生,无需 ONNX
    • 训练:用 JSON 标注意图,直接训练
    • 输出:结构化指令(intent+entities)
  • Snips NLU JS (老牌离线 NLU,几 MB~30MB)https://github.com/snipsco/snips-nlu-js

    • 支持:意图识别 + 槽位提取(你要的指令核心)
    • 训练:自有数据标注,一键训练
    • JS:浏览器 / Node 都能跑

三、JS 运行框架(直接复制网址)

四、二次训练(从 0 / 微调,都支持)

  • 方案 A:用Hugging Face Transformers 微调小模型https://huggingface.co/docs/transformers/training

    • 数据:标注意图 + 实体(如 "打开收银机"→intent:open_cashier)
    • 输出:微调后模型→转 ONNX→JS 运行
  • 方案 B:用Hermes/Snips纯 JS 训练(最快)

    • 无需 Python,直接在 JS 里用 JSON 数据训练
    • 适合小步快跑,快速迭代指令

五、最简 JS 代码

html

预览

复制代码
<script src="https://cdn.jsdelivr.net/npm/@huggingface/transformers@3.0.0"></script>
<script>
  // 加载轻量中文BERT(INT8量化)
  const classifier = await pipeline('text-classification', 'Xenova/chinese-bert-wwm-ext-quantized');
  // 输入自然语言,输出结构化意图
  const result = await classifier('打开收银系统');
  console.log(result); // 输出:[{label: 'open_cashier', score: 0.98}]
</script>

六、快速建议

  1. 先用Hermes NLU(纯 JS,几 MB)快速跑通意图识别
  2. 再用Xenova/chinese-bert-wwm-ext-quantized提升精度
  3. 最后用Transformers.js+WebGPU 加速,支持更大模型

东方仙盟:拥抱知识开源,共筑数字新生态

在全球化与数字化浪潮中,东方仙盟始终秉持开放协作、知识共享的理念,积极拥抱开源技术与开放标准。我们相信,唯有打破技术壁垒、汇聚全球智慧,才能真正推动行业的可持续发展。

开源赋能中小商户:通过将前端异常检测、跨系统数据互联等核心能力开源化,东方仙盟为全球中小商户提供了低成本、高可靠的技术解决方案,让更多商家能够平等享受数字转型的红利。

共建行业标准:我们积极参与国际技术社区,与全球开发者、合作伙伴共同制定开放协议 与技术规范,推动跨境零售、文旅、餐饮等多业态的系统互联互通,构建更加公平、高效的数字生态。

知识普惠,共促发展:通过开源社区 、技术文档与培训体系,东方仙盟致力于将前沿技术转化为可落地的行业实践,赋能全球合作伙伴,共同培育创新人才,推动数字经济 的普惠式增长

阿雪技术观

在科技发展浪潮中,我们不妨积极投身技术共享。不满足于做受益者,更要主动担当贡献者。无论是分享代码、撰写技术博客,还是参与开源项目 维护改进,每一个微小举动都可能蕴含推动技术进步的巨大能量。东方仙盟是汇聚力量的天地,我们携手在此探索硅基 生命,为科技进步添砖加瓦。

Hey folks, in this wild tech - driven world, why not dive headfirst into the whole tech - sharing scene? Don't just be the one reaping all the benefits; step up and be a contributor too. Whether you're tossing out your code snippets , hammering out some tech blogs, or getting your hands dirty with maintaining and sprucing up open - source projects, every little thing you do might just end up being a massive force that pushes tech forward. And guess what? The Eastern FairyAlliance is this awesome place where we all come together. We're gonna team up and explore the whole silicon - based life thing, and in the process, we'll be fueling the growth of technology

相关推荐
财迅通Ai14 小时前
海立股份:公司旗下海立特冷“人体降温系统”入选市级先进技术推荐目录
大数据·人工智能·海立股份
启芯硬件14 小时前
Designcon2026: LPDDR6 如何成为AI数据中心的新王牌?
人工智能·经验分享·硬件工程·硬件设计·电源设计
Nayxxu14 小时前
Gemini、Claude、GPT 多模型网关最小实现方案
人工智能·gpt
郭龙飞98014 小时前
OpenClaw技能拓展教程 五大场景高效办公实操指南
人工智能·windows·语言模型
longerVR14 小时前
自动驾驶(FSD/Autopilot)的数据采集-特斯拉纯视觉方案
人工智能·机器学习·自动驾驶
运维帮手大橙子14 小时前
自动驾驶各模块协作与本质
人工智能·机器学习·自动驾驶
captain_AIouo15 小时前
Captain AI以视频运营破局!助Ozon商家抢占流量红利
大数据·人工智能·经验分享·aigc·音视频
AI医影跨模态组学15 小时前
NPJ Precis Oncol(IF=8)中国科学院深圳先进技术研究院吴红艳教授等团队:深度可解释放射基因组学解析乳腺MRI肿瘤微环境
人工智能·深度学习·论文·医学·医学影像
Artdesign_E15 小时前
如何让AI图文自动生成视频?一键图文转视频指南
图像处理·人工智能·aigc
大模型最新论文速读15 小时前
05-15 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理