【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—更新（正式比赛）

葡萄成熟时_2024-04-18 11:05

【第十二届"泰迪杯"数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索---更新（正式比赛）

全部代码，制作数据、训练权重，结果，视频：

其中，LXS文件夹，代表所有的jupyter代码以及Chinese clip模型代码，基于服务器就可以直接运行，（找我分享服务器镜像，不用再配置环境了）

视频为边做边录制，全程记录训练预测、验证过程。

复制代码

可以微信：zgr421136咨询 （微信优惠-5）
可以QQ交流群：458351399

可以直接爱发电平台：
https://afdian.net/item/8cc7f3dae8d111eeb7b05254001e7c00

良心制作，质量保证，售后解答。

单品一包含全套代码(找我分享服务器镜像，无需配置环境，一键运行)，教程视频，训练的权重与提交结果

获取链接：

复制代码

https://afdian.net/item/e579256ceead11ee9b7352540025c377

单品二包含需要提交结果(28号的提交测试结果csv也会更新)与完结论文

获取链接：

复制代码

https://afdian.net/item/4a9d076aeeae11ee908b52540025c377

（基于小的base16，预训练权重模型训练的，4w条为训练集，1w条为验证集）

只训练了44轮，一轮训练花费15分钟，显存只占6GB左右。

说明：这是训练了44轮，验证效果不算太理想的第一版模型的预测结果。

（对问题二，文本预测检索图片，问题三，图片预测检索文本的部分结果展示），此时验证集的召回验证recall@k5值为60。

图片检索文本结果部分展示：

今晚将进行选择最大最全面的中文预训练模型，对正式数据再进行训练（很费时间，很费资源。本地电脑是一定搞不了的，或服务器或者学校实验室服务器。）

第二版更新将直接上传售后群qq文件夹里，以及百度网盘链接的方式。