老显卡能否运行大语言模型

  1. Meta-Llama-3.1-8B-Instruct

TITAN X Pascal x 2 10.9 token/s 占用显存16.8G

4090 62.6 token/s 占用显存15.6G

  1. Meta-Llama-3.1-8B-Instruct-GPTQ-INT4

TITAN X Pascal 10.4 token/s 占用显存6.5G

3060TI 50.4 token/s 占用显存5.6G

4090 85.0 token/s 占用显存6.2G

3、Meta-Llama-3.1-70B-Instruct-GPTQ-INT4

4090x4 23.6 token/s 占用显存40.8G

如果跑Meta-Llama-3.1-8B-Instruct需要一张大显存显卡,如果跑量化版本Meta-Llama-3.1-8B-Instruct-GPTQ-INT4一般显存显卡也能跑,TITAN X Pascal与1080TI相当,老显示卡也能战大语言模型,只是速度相对慢一些。

相关推荐
易知微EasyV数据可视化4 分钟前
数字孪生+AI:头部能源企业-监测光伏产品生命周期,驱动绿色智造零碳未来
人工智能·经验分享·能源·数字孪生
Rorsion4 分钟前
机器学习概述(概念+分类)
人工智能·机器学习
黎阳之光5 分钟前
黎阳之光:以科技之力赋能城市更新,共筑高品质示范之城
大数据·人工智能·科技
AI营销前沿7 分钟前
原圈科技AI市场分析榜单:2026年如何打破数据孤岛,实现营销增长300%?
大数据·人工智能
(; ̄ェ ̄)。7 分钟前
机器学习入门(十六)集成学习,GBDT,XGBoost
人工智能·机器学习·集成学习
weixin_5498083613 分钟前
2026中国AI招聘系统选型指南:从“效率工具”到“智能体协同”的跃迁
人工智能
zlt200017 分钟前
从Prompt工程到Skill工程:Agent Skills开放标准彻底改变了AI协作方式
人工智能·ai·agent skill
咚咚王者20 分钟前
人工智能之核心技术 深度学习 第九章 框架实操(PyTorch / TensorFlow)
人工智能·pytorch·深度学习
天空属于哈夫克321 分钟前
外部群自动化:将 RPA 从“群发工具”进化为私域“情报感知系统”
人工智能·自然语言处理
大模型最新论文速读24 分钟前
NCoTS:搜索最优推理路径,改进大模型推理效果
人工智能·深度学习·机器学习·语言模型·自然语言处理