【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—更新(正式比赛)

【第十二届"泰迪杯"数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索---更新(正式比赛)

往期链接:

【第十二届"泰迪杯"数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索---解题全流程(持续更新)
【第十二届"泰迪杯"数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索---解题全流程(论文更新)

全家桶更新内容:

全部代码,制作数据、训练权重,结果,视频:

其中,LXS文件夹,代表所有的jupyter代码以及Chinese clip模型代码,基于服务器就可以直接运行,(找我分享服务器镜像,不用再配置环境了)

视频为边做边录制,全程记录训练预测、验证过程。

全家桶获取

复制代码
可以微信:zgr421136咨询 (微信优惠-5)
可以QQ交流群:458351399

可以直接爱发电平台:
https://afdian.net/item/8cc7f3dae8d111eeb7b05254001e7c00

良心制作,质量保证,售后解答。

单品一:

单品一包含全套代码(找我分享服务器镜像,无需配置环境,一键运行),教程视频,训练的权重与提交结果

获取链接:

复制代码
https://afdian.net/item/e579256ceead11ee9b7352540025c377

单品二:

单品二包含需要提交结果(28号的提交测试结果csv也会更新)与完结论文

获取链接:

复制代码
https://afdian.net/item/4a9d076aeeae11ee908b52540025c377

训练、预测展示:

训练,

(基于小的base16,预训练权重模型训练的,4w条为训练集,1w条为验证集)

只训练了44轮,一轮训练花费15分钟,显存只占6GB左右。

预测结果:

说明:这是训练了44轮,验证效果不算太理想的第一版模型的预测结果。

(对问题二,文本预测检索图片,问题三,图片预测检索文本的部分结果展示),此时验证集的召回验证recall@k5值为60。

图片检索文本结果部分展示:


后续计划:

今晚将进行选择最大最全面的中文预训练模型,对正式数据再进行训练(很费时间,很费资源。本地电脑是一定搞不了的,或服务器或者学校实验室服务器。)

  1. 选择最大预训练权重文件进行训练
  2. 训练50轮
  3. 论文编写改进方向优化指导.txt

第二版更新将直接上传售后群qq文件夹里,以及百度网盘链接的方式。

相关推荐
禁默5 分钟前
基于CANN的ops-cv仓库-多模态场景理解与实践
人工智能·cann
2501_9436953312 分钟前
高职大数据与会计专业,考CDA证后能转纯数据分析岗吗?
大数据·数据挖掘·数据分析
禁默14 分钟前
【硬核入门】无需板卡也能造 AI 算子?深度玩转 CANN ops-math 通用数学库
人工智能·aigc·cann
敏叔V58719 分钟前
AI智能体的工具学习进阶:零样本API理解与调用
人工智能·学习
徐小夕@趣谈前端28 分钟前
拒绝重复造轮子?我们偏偏花365天,用Vue3写了款AI协同的Word编辑器
人工智能·编辑器·word
阿里云大数据AI技术28 分钟前
全模态、多引擎、一体化,阿里云DLF3.0构建Data+AI驱动的智能湖仓平台
人工智能·阿里云·云计算
陈天伟教授29 分钟前
人工智能应用- 语言理解:05.大语言模型
人工智能·语言模型·自然语言处理
池央30 分钟前
CANN GE 深度解析:图编译器的核心优化策略、执行流调度与模型下沉技术原理
人工智能·ci/cd·自动化
七月稻草人33 分钟前
CANN ops-nn:AIGC底层神经网络算力的核心优化引擎
人工智能·神经网络·aigc·cann
种时光的人33 分钟前
CANN仓库核心解读:ops-nn打造AIGC模型的神经网络算子核心支撑
人工智能·神经网络·aigc