【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—更新(正式比赛)

【第十二届"泰迪杯"数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索---更新(正式比赛)

往期链接:

【第十二届"泰迪杯"数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索---解题全流程(持续更新)
【第十二届"泰迪杯"数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索---解题全流程(论文更新)

全家桶更新内容:

全部代码,制作数据、训练权重,结果,视频:

其中,LXS文件夹,代表所有的jupyter代码以及Chinese clip模型代码,基于服务器就可以直接运行,(找我分享服务器镜像,不用再配置环境了)

视频为边做边录制,全程记录训练预测、验证过程。

全家桶获取

复制代码
可以微信:zgr421136咨询 (微信优惠-5)
可以QQ交流群:458351399

可以直接爱发电平台:
https://afdian.net/item/8cc7f3dae8d111eeb7b05254001e7c00

良心制作,质量保证,售后解答。

单品一:

单品一包含全套代码(找我分享服务器镜像,无需配置环境,一键运行),教程视频,训练的权重与提交结果

获取链接:

复制代码
https://afdian.net/item/e579256ceead11ee9b7352540025c377

单品二:

单品二包含需要提交结果(28号的提交测试结果csv也会更新)与完结论文

获取链接:

复制代码
https://afdian.net/item/4a9d076aeeae11ee908b52540025c377

训练、预测展示:

训练,

(基于小的base16,预训练权重模型训练的,4w条为训练集,1w条为验证集)

只训练了44轮,一轮训练花费15分钟,显存只占6GB左右。

预测结果:

说明:这是训练了44轮,验证效果不算太理想的第一版模型的预测结果。

(对问题二,文本预测检索图片,问题三,图片预测检索文本的部分结果展示),此时验证集的召回验证recall@k5值为60。

图片检索文本结果部分展示:


后续计划:

今晚将进行选择最大最全面的中文预训练模型,对正式数据再进行训练(很费时间,很费资源。本地电脑是一定搞不了的,或服务器或者学校实验室服务器。)

  1. 选择最大预训练权重文件进行训练
  2. 训练50轮
  3. 论文编写改进方向优化指导.txt

第二版更新将直接上传售后群qq文件夹里,以及百度网盘链接的方式。

相关推荐
szxinmai主板定制专家15 分钟前
基于 ZYNQ ARM+FPGA+AI YOLOV4 的电网悬垂绝缘子缺陷检测系统的研究
arm开发·人工智能·嵌入式硬件·yolo·fpga开发
聚客AI43 分钟前
🌈提示工程已过时?上下文工程从理论到实践的完整路线图
人工智能·llm·agent
C嘎嘎嵌入式开发1 小时前
(二) 机器学习之卷积神经网络
人工智能·机器学习·cnn
文心快码BaiduComate1 小时前
开工不累,双强护航:文心快码接入 DeepSeek-V3.2-Exp和 GLM-4.6,助你节后高效Coding
前端·人工智能·后端
AI小云1 小时前
【Python与AI基础】Python编程基础:函数与参数
人工智能·python
white-persist1 小时前
MCP协议深度解析:AI时代的通用连接器
网络·人工智能·windows·爬虫·python·自动化
新智元1 小时前
谷歌杀入诺奖神殿,两年三冠五得主!世界TOP3重现贝尔实验室神话
人工智能·openai
StarPrayers.1 小时前
卷积层(Convolutional Layer)学习笔记
人工智能·笔记·深度学习·学习·机器学习
skywalk81632 小时前
AutoCoder Nano 是一款轻量级的编码助手, 利用大型语言模型(LLMs)帮助开发者编写, 理解和修改代码。
人工智能