LiteRT-LM边缘平台上高效运行语言模型

谷歌发布高效运行语言模型的 C++ 库:LiteRT-LM

LiteRT-LM 支持跨平台高效运行 Gemma-3N 系列模型,支持 2B 和 4B 参数模型,适用于桌面环境(Mac/Windows/Linux)及物联网设备

语言模型不再是一个单一模型,而是一个由多个模型和组件协同工作的流水线。LiteRT-LM 基于 LiteRT 构建,以支持这些流水线,包括:

  • C++ API 高效运行语言模型
  • 跨平台支持,通过便携式 C++ 实现广泛部署场景
  • 灵活可定制,满足您的特定功能需求
  • 硬件加速,释放设备硬件的全部潜能

参考开源

https://github.com/google-ai-edge/LiteRT-LM

https://huggingface.co/google/gemma-3n-E2B-it-litert-lm-preview

相关推荐
HackTwoHub13 小时前
AI提示词注入绕过工具:一键绕过Codex/Claude安全限制,CTF夺旗与渗透测试必备神器
网络·人工智能·安全·web安全·系统安全·网络攻击模型·安全架构
诺未科技_NovaTech13 小时前
Microsoft 365 E7 ,“AI+安全+身份”三位一体,打造 AI 时代的一站式操作系统
人工智能·安全·microsoft
小白学大数据13 小时前
均线选股策略研究:基于 Python 数据分析实现
人工智能·python·数据分析
三无推导14 小时前
OpenHuman 开源项目详解:个人 AI 助手架构与核心技术拆解
人工智能·性能优化·架构·开源·ai助手
薛定猫AI14 小时前
【深度解析】Hermes Agent 与 Hermes Desktop:长期记忆、技能沉淀与多端网关的开源 AI Agent 实战
人工智能·开源
xwz小王子14 小时前
给机器人装上脊髓反射:AT-VLA 如何把触觉塞进 VLA,并把闭环响应压到 40 毫秒
人工智能·机器人
通信小呆呆14 小时前
注意力机制用于信号同步:从匹配滤波到可学习对齐
人工智能·学习·机器学习·信息与通信
掌动智能14 小时前
传统数据工厂之死:RunnerAgent如何开启AI驱动的“数据生产”新纪元
人工智能·测试工具·自动化
shchojj14 小时前
Generative AI applications -- Reading
人工智能
青山科技分享14 小时前
iPaaS推荐:五大集成平台推荐指南
大数据·人工智能·ipaas推荐