单条推理转批量推理prompt

为了将单条推理程序改为批量推理程序,并实现您的要求,我们需要进行以下步骤:

输入的图片和视频都是随机从视频文件夹、图片文件夹挑选,组成输入对:

需要编写一个函数来读取指定文件夹中的所有图片和视频文件。

使用随机选择机制来组合这些文件作为输入对。

加入多线程:

使用 concurrent.futures.ThreadPoolExecutor 来管理多线程任务。

让每个GPU都固定加载需要的模型,避免重复加载、释放模型:

在初始化时为每个GPU加载一次模型,并在多线程中复用这些模型。

生成线程时动态选择GPU,如果选择好了,这个线程全周期一直在当前GPU,防止张量、数据不在同一块GPU:

在每个线程中设置环境变量 CUDA_VISIBLE_DEVICES,以确保每个线程只使用指定的GPU。

相关推荐
格砸2 分钟前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云16 分钟前
可观测性 4.0:教系统如何思考
人工智能
sunny86529 分钟前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔1 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能
smallyoung1 小时前
AgenticRAG:智能体驱动的检索增强生成
人工智能
_skyming_1 小时前
OpenCode 如何做到结果不做自动质量评估,为什么结果还不错?
人工智能
南山安1 小时前
手写 Cursor 核心原理:从 Node.js 进程到智能 Agent
人工智能·agent·设计
掘金安东尼2 小时前
如何为 AI 编码代理配置 Next.js 项目
人工智能
aircrushin2 小时前
轻量化大模型架构演进
人工智能·架构
文心快码BaiduComate3 小时前
百度云与光本位签署战略合作:用AI Agent 重构芯片研发流程
前端·人工智能·架构