LiteRT-LM边缘平台上高效运行语言模型

谷歌发布高效运行语言模型的 C++ 库:LiteRT-LM

LiteRT-LM 支持跨平台高效运行 Gemma-3N 系列模型,支持 2B 和 4B 参数模型,适用于桌面环境(Mac/Windows/Linux)及物联网设备

语言模型不再是一个单一模型,而是一个由多个模型和组件协同工作的流水线。LiteRT-LM 基于 LiteRT 构建,以支持这些流水线,包括:

  • C++ API 高效运行语言模型
  • 跨平台支持,通过便携式 C++ 实现广泛部署场景
  • 灵活可定制,满足您的特定功能需求
  • 硬件加速,释放设备硬件的全部潜能

参考开源

https://github.com/google-ai-edge/LiteRT-LM

https://huggingface.co/google/gemma-3n-E2B-it-litert-lm-preview

相关推荐
梵得儿SHI6 分钟前
(第一篇)Spring AI 核心技术攻坚:RAG 全流程落地指南|从理论到实战构建本地知识库问答系统
人工智能·spring·大模型落地·增强生成(rag)技术·大模型存在的知识滞后·大模型存在的知识幻觉·提升回答可信度
张彦峰ZYF6 分钟前
AI赋能原则3解读思考:可得性时代-AI 正在重写人类能力结构的未来
人工智能·ai·ai赋能与落地
CoovallyAIHub7 分钟前
AI 项目如何避免“烂尾”?怎么选择才能让AI项目长期奔跑?
人工智能·算法·计算机视觉
hudawei9969 分钟前
词嵌入中语料库矩阵和句子矩阵是怎样的?
人工智能·ai·自然语言处理·词嵌入·word embedding·词向量·语义理解
Mxsoft6199 分钟前
某次数据分析偏差,发现时区设置错,修正时间戳救场!
人工智能
努力也学不会java11 分钟前
【docker】Docker Register(镜像仓库)
运维·人工智能·机器学习·docker·容器
m0_6501082411 分钟前
OLMo 2:全开放语言模型的技术突破与实践
论文阅读·人工智能·olmo 2·全开源多模态大模型·全链路开放·训练稳定性
Mintopia12 分钟前
🧠 AIGC技术标准制定:Web行业协同的必要性与难点
人工智能·前端框架·trae
轻竹办公PPT12 分钟前
AI一键生成年终总结PPT
人工智能·python·powerpoint
是Dream呀12 分钟前
昇腾平台 PyTorch 迁移实操:从环境搭建到精度达标的完整步骤
人工智能·pytorch·python·昇腾