通用多模态检索——大模型微调

1、7B的模型,参数量就占到了16G,而且你要检索,要把所有的候选项candidate全部变成向量嵌入,然后计算相似度,3090的24G显存很容易爆,而且数据量一旦大了一点,达到几万,基本就很难跑通了。如果输入还有图像的话,显存更加容易溢出,可以在加载模型的时候,限制图片输入的像素,例如max_pixel参数,加载模型的时候也可以使用int4量化。

2、例如原来是在64G的显存上跑,有些时候,即使你把batch_size改成1,num_workers改成0,也依然在24G的显存上跑不了。

3、一般原来的论文用到H200,A100,基本上完整全部复现论文也需要这个配置,24G可能只能复现部分论文。

相关推荐
求学中--18 小时前
【腾讯位置服务开发者征文大赛】AI时空漫游者——基于MCP协议与AI Agent的智能地图冒险系统
人工智能
AAA大运重卡何师傅(专跑国道)18 小时前
OpenAI Agents SDK02
人工智能
生信之灵18 小时前
追踪17只果蝇、7只线虫、10只小鼠,全程无需人工标注:这个无监督跟踪器如何颠覆动物行为研究?
人工智能·深度学习·神经网络·microsoft·交互
Purple Coder18 小时前
电力系统分析 第一章
深度学习
IT策士18 小时前
深度对比:OpenCode vs Kiro — 企业 AI 编程工具选型指南
人工智能
百度安全18 小时前
HugeGraph 晋升 Apache 顶级项目 百度安全持续筑牢 AI 时代图数据基础设施
数据库·人工智能·安全·知识图谱
Irissgwe18 小时前
LangChain之核心组件(文档加载器Document loaders)
人工智能·ai·langchain·llm·rag·langgraph·文档加载器
东哥爱编程18 小时前
开发者必看!全网高性价比 AI API 聚合站:apidg.xyz (支持 573 个模型)
人工智能
humcomm18 小时前
AI 编程时代-全栈开发技术栈解析
开发语言·人工智能
guo_xiao_xiao_18 小时前
YOLOv11城市道路自行车目标检测数据集-999张-Bicycle-1
人工智能·yolo·目标检测