AI软件栈:推理框架(二)-Llama CPP1

Llama CPP的主要构造,GGUF和GGML为两个主要部分,包括模型描述文件和模型参数存储文件

文章目录

GGUF

  • llama.cpp 的作者 Georgi Gerganov 提出的新一代大模型描述文件 GPT-Generated Unified Format,继承自GGML,但是克服了GGML的一些缺点
    • 例如,缺少版本信息难以向后兼容;信息增加或者修改不变,手动修改模型信息不方便等;

构建图

  • 通过llma_bulid_graph在不同的基础模型之上进行参数设计(例如 llama、baichuan、MINICPM 、GEMMA、STARCODER、BERT、QW、QW2等,甚至还有MEMBA)
  • 在每个类GPT之中,通过基函数描述了计算流,同时通过暴露层数、token维度等参数作为可调模型

读取权重

  • 设计了基于分块的tensor组装,同时使用描述文件将对每个tensor及其size进行区分
相关推荐
义嘉泰几秒前
把显示、触控和手写笔都管起来
人工智能·芯片
Soari2 分钟前
GitHub 开源项目解析:supermemoryai/supermemory —— AI 时代的持久记忆引擎
人工智能·github·开源项目·mcp·ai记忆引擎·下文搜索
实在智能RPA2 分钟前
2026 金融信创替代转型:Agent如何赋能业务平稳过渡?
大数据·人工智能·ai·金融
_Aaron___2 分钟前
RAG 知识库越用越脏?先把“增量更新”设计清楚
java·人工智能
装不满的克莱因瓶3 分钟前
实现矩阵的点积:从数学原理到 NumPy 实战
人工智能·线性代数·算法·机器学习·矩阵·numpy
HyperAI超神经3 分钟前
在线教程丨英伟达开源LocateAnything,3B模型可实现图像+视频的目标指向/开放词汇目标检测/指代表达定位/OCR文本定位等功能
人工智能·目标检测·计算机视觉·ocr·目标文本定位
库拉大叔4 分钟前
KULAAI 一站式 AI 编程与模型聚合平台效果实测
人工智能
诸葛务农5 分钟前
溶液纳米颗粒净化技术及其在光刻胶纳过滤和提纯中的应用(上)
人工智能
oort1235 分钟前
VLStream 全开源决策式 AI 视频平台 技术视角完整说明
大数据·开发语言·人工智能·经验分享·python·开源·音视频
Cloud_Shy6186 分钟前
解读《Effective Python 3rd Edition》:从练气到老魔(第二章 Item 10 - 12)
c语言·开发语言·网络·人工智能·windows·python·编辑器