LiteRT-LM边缘平台上高效运行语言模型

谷歌发布高效运行语言模型的 C++ 库:LiteRT-LM

LiteRT-LM 支持跨平台高效运行 Gemma-3N 系列模型,支持 2B 和 4B 参数模型,适用于桌面环境(Mac/Windows/Linux)及物联网设备

语言模型不再是一个单一模型,而是一个由多个模型和组件协同工作的流水线。LiteRT-LM 基于 LiteRT 构建,以支持这些流水线,包括:

  • C++ API 高效运行语言模型
  • 跨平台支持,通过便携式 C++ 实现广泛部署场景
  • 灵活可定制,满足您的特定功能需求
  • 硬件加速,释放设备硬件的全部潜能

参考开源

https://github.com/google-ai-edge/LiteRT-LM

https://huggingface.co/google/gemma-3n-E2B-it-litert-lm-preview

相关推荐
水木流年追梦20 小时前
CodeTop Top 300 热门题目2-最长回文子串
开发语言·人工智能·python·算法·leetcode
人工智能AI技术20 小时前
缓存基础知识:缓存策略、过期、击穿与雪崩
人工智能
生信之灵20 小时前
拓扑与曲率双剑合璧:scGeom如何从单细胞数据中“看见”细胞命运
人工智能·深度学习·算法·单细胞·多组学
云烟成雨TD20 小时前
Spring AI Alibaba 1.x 系列【33】Human-in-the-Loop(人在回路)演示
java·人工智能·spring
今天你TLE了吗20 小时前
LLM到Agent&RAG——AI概念概述 第五章:Skill
人工智能·笔记·后端·学习
网安情报局20 小时前
弹性云服务器跟游戏行业有什么关系?
人工智能
人工智能AI技术20 小时前
梯度下降基础:AI 模型自我优化的核心方法
人工智能
kishu_iOS&AI20 小时前
深度学习 —— 梯度下降法的优化方法
人工智能·pytorch·python·深度学习
MobotStone20 小时前
拼多多为什么弱化购物车?
人工智能
Rabbit_QL20 小时前
【权重】离线环境怎么用预训练权重
人工智能·pytorch