技术栈
什么是cpp (c++ c plus plus) 版模型
领航猿1号
2024-06-18 21:10
.cpp 模型指的是纯 C/C++ 实现,无需外部依赖。
针对使用 ARM NEON、Accelerate 和 Metal 框架的 Apple 芯片进行了优化。
支持适用于 x86 架构的 AVX、AVX2 和 AVX512。
提供 F16/F32 混合精度,并支持 2 位至 8 位整数量化。
常见的示例
ChatGLM cpp:
GitHub - li-plus/chatglm.cpp: C++ implementation of ChatGLM-6B & ChatGLM2-6B & ChatGLM3 & more LLMs
Llama cpp:
GitHub - ggerganov/llama.cpp: LLM inference in C/C++
人工智能
自然语言处理
aigc
上一篇:
计算机专业毕设-校园二手交易平台
下一篇:
Java17 --- RabbitMQ搭建集群
相关推荐
小白狮ww
3 分钟前
要给 OCR 装个脑子吗?DeepSeek-OCR 2 让文档不再只是扫描
人工智能
·
深度学习
·
机器学习
·
ocr
·
cpu
·
gpu
·
deepseek
lili-felicity
4 分钟前
CANN优化LLaMA大语言模型推理:KV-Cache与FlashAttention深度实践
人工智能
·
语言模型
·
llama
程序猿追
7 分钟前
深度解码昇腾 AI 算力引擎:CANN Runtime 核心架构与技术演进
人工智能
·
架构
金融RPA机器人丨实在智能
7 分钟前
Android Studio开发App项目进入AI深水区:实在智能Agent引领无代码交互革命
android
·
人工智能
·
ai
·
android studio
Token_w
10 分钟前
CANN算子量化——AIGC轻量化部署的低精度算子适配方案
aigc
lili-felicity
10 分钟前
CANN异步推理实战:从Stream管理到流水线优化
大数据
·
人工智能
那个村的李富贵
10 分钟前
CANN驱动下的AIGC“智能抠图”:基于Mask2Former的高性能图像分割实战
aigc
·
cann
做人不要太理性
11 分钟前
CANN Runtime 运行时组件深度解析:任务下沉执行、异构内存规划与全栈维测诊断机制
人工智能
·
神经网络
·
魔珐星云
不爱学英文的码字机器
11 分钟前
破壁者:CANN ops-nn 仓库与昇腾 AI 算子优化的工程哲学
人工智能
晚霞的不甘
14 分钟前
CANN 编译器深度解析:TBE 自定义算子开发实战
人工智能
·
架构
·
开源
·
音视频
热门推荐
01
GitHub 镜像站点
02
Claude Code + GLM4.7 避坑指南:解决 Unable to connect to Anthropic services
03
使用 1panel面板 部署 php网站
04
Vue-skills的中文文档
05
OpenClaw Chrome扩展使用教程 - 浏览器中继控制
06
让 Trae IDE 智能体 “读懂”文档 Excel+PDF+DOCX :mcp-documents-reader 工具使用指南
07
从零搭建一个 PHP 登录注册系统(含完整源码)
08
UV安装并设置国内源
09
Linux下V2Ray安装配置指南
10
一文了解国产算子编程语言 TileLang,TileLang 对国产开源生态的影响与启示