通用多模态检索——大模型微调

1、7B的模型,参数量就占到了16G,而且你要检索,要把所有的候选项candidate全部变成向量嵌入,然后计算相似度,3090的24G显存很容易爆,而且数据量一旦大了一点,达到几万,基本就很难跑通了。如果输入还有图像的话,显存更加容易溢出,可以在加载模型的时候,限制图片输入的像素,例如max_pixel参数,加载模型的时候也可以使用int4量化。

2、例如原来是在64G的显存上跑,有些时候,即使你把batch_size改成1,num_workers改成0,也依然在24G的显存上跑不了。

3、一般原来的论文用到H200,A100,基本上完整全部复现论文也需要这个配置,24G可能只能复现部分论文。

相关推荐
aqi005 小时前
15天学会AI应用开发(七)有了大模型为什么还要引入RAG
人工智能·python·大模型·ai编程·ai应用
用户5191495848456 小时前
libcurl Headers API 释放后重利用漏洞:跨请求复用头句柄导致堆内存安全风险
人工智能·aigc
踩蚂蚁6 小时前
自定义语音唤醒词:从训练到部署的完整链路实践
人工智能
用户5191495848456 小时前
CVE-2025-1094 PostgreSQL SQL注入与WebSocket劫持远程代码执行利用工具
人工智能·aigc
IT_陈寒7 小时前
SpringBoot自动配置这个坑,我踩进去又爬出来了
前端·人工智能·后端
冬奇Lab18 小时前
Agent 系列(23):Web Agent——让 Agent 真正浏览网页
人工智能·llm·agent
冬奇Lab19 小时前
每日一个开源项目(第135篇):codebase-memory-mcp - 给 AI Agent 一张代码库的知识图谱
人工智能·开源·llm