caffe适配cudnn9.6.0(ai修改代码踩坑)

caffe适配cudnn:https://github.com/dyc2424748461/caffe

(测试一下,成没成,反正我看到它用gpu了😶)

因为突发奇想,想要玩easymocap,先是简单使用media跑通了一下,然后过了几天,又想使用openpose。在安装openpose的时候发现,caffe版本已经是六七年前了,有人适配了cudnn8.0,但是搜了很久也没有找到适配cudnn9.x的,于是乎咱们就想到现在ai都那么强大了,而且任务还是比较清晰的,就使用了ai试试。

刚开始并不知道现在已经有比较完善的智能体,先是尝试了千问,豆包,感觉不太行,老是让我自己写。很烦,而且报错上的处理真的很潦草。于是乎开始在网络上搜索可以完成这类的ai,然后搜到了智能体,尝试了有

复制代码
mgx(emmm,因为没充钱老是暂停,体验感上稍弱一点,代码也写了部分,但是老是暂停,太耗时间了于是转移阵地了),
claude3.7(很强但是得我自己试跑运行然后反馈报错),
openhans(免费赠送的额度使用起来很爽)。

然后主要的程序使用openhands修改的,它在它的环境测试完成后,然后自己运行的时候,有部分报错,把报错发给它的话,他给出了解决方案,但是报错的问题是可能多方面导致的,所以它也不确定是为什么。而且重要的一点是,咱们完全是小白啊。不是很懂这里面的运行逻辑。

然后咱把这个点单独摘出来,问了claude,chatgpt,grok,千问,豆包,等等,给出的答案也都是差不多的,然后我就一个一个排错呗,但是可恶的是按照他们给的修改代码,修改后完全不起作用,而且有的给出要修改四五个文件,我都炸了,但是我也可怜兮兮的改了,根本没有效果,还引发了其他的报错。

这一下炸开了,开始自己动手丰衣足食了。一个一个问可能出现的原因,然后自己去排查,排查排查着猛然发现我自己真是个der,直接让它写个脚本帮我检测不就好了,好家伙,这下可来劲了。

最终确定各个版本兼容,好了不是环境的问题了。

这样排查出来那就是代码的问题了,难道openhands欺骗我了,于是在他的虚拟机里运行试了试,确实可以啊,但是看了它之前修改代码和运行的日志,欸,有点不对劲,有点不对劲,它这个版本是cpu版本的,根本不是我想要的gpu版本,还是之前被那几个mgx错误搞混了头脑,openhands行了,就无条件相信他了。好了让它重新写一版吧。

这次紧盯着openhands,虽然它有的操作着实惊呆我了,佛挡杀佛,魔挡杀魔,有的不仅改了自己的文件还删除了一些文件。为了目的不择手段,很好我很喜欢。

过了不知多久,它说好了,我这次很辩证的看着它的修改日志,有点陷入了沉思,这改了cudnn的官方文件,这删除了自己的文件,真的不会报错嘛,但是它说测试成功了,那咱们在他的环境里试试吧。一试,ok,可以运行。

现在在自己的环境里开始测试,这一测试。。。。emmm,报错,,把报错发给openhands,没事,小问题,直接解决,自己环境运行有报错,在发给他,ok,小问题,再发给他,ok,小问题。。。那么缠绵了几个来回,好了有个问题开始多种方案了,它竟然让我降低版本了,好狡猾。

咱们肯定先信他一信,版本安装了将近半个多小时,运行报错,然后丢给他,ok,小问题,出错,再丢给它,小问题,又缠绵了很久。又有个问题卡住了,卡住了。

然后咱们只请出其他的老大哥了,chatgpt,claude,grok。都尝试一遍,似乎没有得到很有用的消息,把全部报错都丢给它们,好的,他们说改咱们就改,很听劝的。改了改去,突然有个版本运行成功了,赶紧保存那个代码,正以为要走向胜利的时候,结果还是当头一棒。

一看这个版本不对啊。虽然也能跑,但是是cuda11.8啊,不行不符合咱们的目标。咱的目标是要适配到cuda12.x的,ok接着改,这种报错这种修改,各种报错各种修改,现在已经把caffe的源码差不多摸得透透的了,已经知道它整个的运行流程了。

突发一个难解决的问题,又问了将近两天,完全没有头绪。有个文件一直显示找不到函数,而且那个函数是在cuda里面的,而且我设置了使用nvcc进行编译了,把错误(只发了error)全都发给ai们,给出解决方案,咱们改!改了改去,那个错误并没有解决,放弃一天休息一下

脑袋开始各种闪回,可能的错误有哪些,还有哪些步骤是不是错了。

结果没想到的是,有个代码ai们都让我往前放,而且我放完还问了他们,都说可以,真的太傻了。不该相信他们的。虽然我也感觉不对,但是这次能找到整个错误完全是因为我自己去读代码的时候,真的感觉不顺 ,用疑问并质疑的语气问的grok,然后给出了答案,有指定了一个文件使用特定的编译器(因为之前编译成功了,根本就没有想到是这个问题)。然后开始验证~~

可以,可以,编译运行成功,进行测试。可以可以,使用了gpu。然后进行了一点点的旧的api的更换,让日志显示正确的版本信息。ok了,然后后面又开始了半个多个小时的新环境中的编译。成功编译。

测试成功。到此为止吧。

也不知道最后成没成,就放这吧。

相关推荐
昨日之日20069 小时前
Wan2.2-S2V - 音频驱动图像生成电影级质量的数字人视频 ComfyUI工作流 支持50系显卡 一键整合包下载
人工智能·音视频
SEO_juper11 小时前
大型语言模型SEO(LLM SEO)完全手册:驾驭搜索新范式
人工智能·语言模型·自然语言处理·chatgpt·llm·seo·数字营销
攻城狮7号12 小时前
腾讯混元翻译模型Hunyuan-MT-7B开源,先前拿了30个冠军
人工智能·hunyuan-mt-7b·腾讯混元翻译模型·30个冠军
zezexihaha12 小时前
从“帮写文案”到“管生活”:个人AI工具的边界在哪?
人工智能
算家云12 小时前
nano banana官方最强Prompt模板来了!六大场景模板详解
人工智能·谷歌·ai大模型·算家云·ai生图·租算力,到算家云·nano banana 提示词
暴躁的大熊12 小时前
AI助力决策:告别生活与工作中的纠结,明析抉择引领明智选择
人工智能
Gyoku Mint12 小时前
提示词工程(Prompt Engineering)的崛起——为什么“会写Prompt”成了新技能?
人工智能·pytorch·深度学习·神经网络·语言模型·自然语言处理·nlp
梁小憨憨12 小时前
zotero扩容
人工智能·笔记
大数据张老师13 小时前
AI架构师的思维方式与架构设计原则
人工智能·架构师·ai架构·后端架构
AKAMAI13 小时前
Entity Digital Sports 降低成本并快速扩展
人工智能·云计算