LiteRT-LM边缘平台上高效运行语言模型

谷歌发布高效运行语言模型的 C++ 库:LiteRT-LM

LiteRT-LM 支持跨平台高效运行 Gemma-3N 系列模型,支持 2B 和 4B 参数模型,适用于桌面环境(Mac/Windows/Linux)及物联网设备

语言模型不再是一个单一模型,而是一个由多个模型和组件协同工作的流水线。LiteRT-LM 基于 LiteRT 构建,以支持这些流水线,包括:

  • C++ API 高效运行语言模型
  • 跨平台支持,通过便携式 C++ 实现广泛部署场景
  • 灵活可定制,满足您的特定功能需求
  • 硬件加速,释放设备硬件的全部潜能

参考开源

https://github.com/google-ai-edge/LiteRT-LM

https://huggingface.co/google/gemma-3n-E2B-it-litert-lm-preview

相关推荐
IT_陈寒12 分钟前
React的useEffect依赖数组把我坑惨了,真相其实很简单
前端·人工智能·后端
Kapaseker25 分钟前
什么?Stack Overflow 给 AI 做了个 Stack Overflow
人工智能
aneasystone本尊44 分钟前
让小龙虾自己写手册:Skill Workshop
人工智能
火山引擎开发者社区1 小时前
一篇看懂 VKE AI Profiling:AI 应用性能分析优化实战
人工智能
IT乐手1 小时前
马斯克的AI模型Grok,竟然帮美军炸了伊朗?!
人工智能
AI袋鼠帝1 小时前
斥资500元/上亿Token,深度横评4个顶尖模型的真实排名~
人工智能
大刚测试开发实战11 小时前
TestHub V0.2.2版本发布,附更新指南
人工智能
冬奇Lab12 小时前
Agent 系列(21):Harness 测试工程——45 个测试怎么设计,以及它发现了什么 bug
人工智能·llm·agent
冬奇Lab12 小时前
每日一个开源项目(第133篇):EchoBird - 把 AI 工具的安装和部署做成傻瓜操作
人工智能·开源·资讯
IT_陈寒13 小时前
Redis的SETNX并发问题让我加了三天班
前端·人工智能·后端