caffe适配cudnn9.6.0(ai修改代码踩坑)

caffe适配cudnn:https://github.com/dyc2424748461/caffe

(测试一下,成没成,反正我看到它用gpu了😶)

因为突发奇想,想要玩easymocap,先是简单使用media跑通了一下,然后过了几天,又想使用openpose。在安装openpose的时候发现,caffe版本已经是六七年前了,有人适配了cudnn8.0,但是搜了很久也没有找到适配cudnn9.x的,于是乎咱们就想到现在ai都那么强大了,而且任务还是比较清晰的,就使用了ai试试。

刚开始并不知道现在已经有比较完善的智能体,先是尝试了千问,豆包,感觉不太行,老是让我自己写。很烦,而且报错上的处理真的很潦草。于是乎开始在网络上搜索可以完成这类的ai,然后搜到了智能体,尝试了有

复制代码
mgx(emmm,因为没充钱老是暂停,体验感上稍弱一点,代码也写了部分,但是老是暂停,太耗时间了于是转移阵地了),
claude3.7(很强但是得我自己试跑运行然后反馈报错),
openhans(免费赠送的额度使用起来很爽)。

然后主要的程序使用openhands修改的,它在它的环境测试完成后,然后自己运行的时候,有部分报错,把报错发给它的话,他给出了解决方案,但是报错的问题是可能多方面导致的,所以它也不确定是为什么。而且重要的一点是,咱们完全是小白啊。不是很懂这里面的运行逻辑。

然后咱把这个点单独摘出来,问了claude,chatgpt,grok,千问,豆包,等等,给出的答案也都是差不多的,然后我就一个一个排错呗,但是可恶的是按照他们给的修改代码,修改后完全不起作用,而且有的给出要修改四五个文件,我都炸了,但是我也可怜兮兮的改了,根本没有效果,还引发了其他的报错。

这一下炸开了,开始自己动手丰衣足食了。一个一个问可能出现的原因,然后自己去排查,排查排查着猛然发现我自己真是个der,直接让它写个脚本帮我检测不就好了,好家伙,这下可来劲了。

最终确定各个版本兼容,好了不是环境的问题了。

这样排查出来那就是代码的问题了,难道openhands欺骗我了,于是在他的虚拟机里运行试了试,确实可以啊,但是看了它之前修改代码和运行的日志,欸,有点不对劲,有点不对劲,它这个版本是cpu版本的,根本不是我想要的gpu版本,还是之前被那几个mgx错误搞混了头脑,openhands行了,就无条件相信他了。好了让它重新写一版吧。

这次紧盯着openhands,虽然它有的操作着实惊呆我了,佛挡杀佛,魔挡杀魔,有的不仅改了自己的文件还删除了一些文件。为了目的不择手段,很好我很喜欢。

过了不知多久,它说好了,我这次很辩证的看着它的修改日志,有点陷入了沉思,这改了cudnn的官方文件,这删除了自己的文件,真的不会报错嘛,但是它说测试成功了,那咱们在他的环境里试试吧。一试,ok,可以运行。

现在在自己的环境里开始测试,这一测试。。。。emmm,报错,,把报错发给openhands,没事,小问题,直接解决,自己环境运行有报错,在发给他,ok,小问题,再发给他,ok,小问题。。。那么缠绵了几个来回,好了有个问题开始多种方案了,它竟然让我降低版本了,好狡猾。

咱们肯定先信他一信,版本安装了将近半个多小时,运行报错,然后丢给他,ok,小问题,出错,再丢给它,小问题,又缠绵了很久。又有个问题卡住了,卡住了。

然后咱们只请出其他的老大哥了,chatgpt,claude,grok。都尝试一遍,似乎没有得到很有用的消息,把全部报错都丢给它们,好的,他们说改咱们就改,很听劝的。改了改去,突然有个版本运行成功了,赶紧保存那个代码,正以为要走向胜利的时候,结果还是当头一棒。

一看这个版本不对啊。虽然也能跑,但是是cuda11.8啊,不行不符合咱们的目标。咱的目标是要适配到cuda12.x的,ok接着改,这种报错这种修改,各种报错各种修改,现在已经把caffe的源码差不多摸得透透的了,已经知道它整个的运行流程了。

突发一个难解决的问题,又问了将近两天,完全没有头绪。有个文件一直显示找不到函数,而且那个函数是在cuda里面的,而且我设置了使用nvcc进行编译了,把错误(只发了error)全都发给ai们,给出解决方案,咱们改!改了改去,那个错误并没有解决,放弃一天休息一下

脑袋开始各种闪回,可能的错误有哪些,还有哪些步骤是不是错了。

结果没想到的是,有个代码ai们都让我往前放,而且我放完还问了他们,都说可以,真的太傻了。不该相信他们的。虽然我也感觉不对,但是这次能找到整个错误完全是因为我自己去读代码的时候,真的感觉不顺 ,用疑问并质疑的语气问的grok,然后给出了答案,有指定了一个文件使用特定的编译器(因为之前编译成功了,根本就没有想到是这个问题)。然后开始验证~~

可以,可以,编译运行成功,进行测试。可以可以,使用了gpu。然后进行了一点点的旧的api的更换,让日志显示正确的版本信息。ok了,然后后面又开始了半个多个小时的新环境中的编译。成功编译。

测试成功。到此为止吧。

也不知道最后成没成,就放这吧。

相关推荐
北京地铁1号线17 分钟前
机器学习笔试选择题:题组2
人工智能·算法·机器学习
算家云39 分钟前
OpenAI秘密测试ChatGPT安全路由,情感对话触发GPT-5严格审查
人工智能·chatgpt·算家云·openai秘密测试安全路由·算家计算·租算力,就到算家云
新加坡内哥谈技术40 分钟前
OpenAI近日推出了一项名为 ChatGPT Pulse 的全新功能
人工智能·chatgpt
hunteritself41 分钟前
DeepSeek V3.1-Terminus、阿里 Qwen3-Max、ChatGPT Pulse 同周登场!| AI Weekly 9.22-9.28
人工智能·ios·chatgpt·语音识别·iphone
ai_xiaogui44 分钟前
ChatGPT开源模型发布!部署20B/120B AI模型实战指南
人工智能·chatgpt·20b 120b模型部署教程·本地部署chatgpt模型实战·高性能加速开源ai模型开发·开源模型windows配置方法
春末的南方城市44 分钟前
阿里开源视频修复方法Vivid-VR:以独特策略与架构革新,引领生成视频修复高质量可控新时代。
人工智能·深度学习·机器学习·计算机视觉·aigc
Juchecar1 小时前
人工智能重塑人类生活范式
人工智能
FIT2CLOUD飞致云1 小时前
飞致云开源社区月度动态报告(2025年9月)
人工智能·开源
量子位1 小时前
宇树机器人被曝漏洞,机器人之间可相互感染,官方火速回应
人工智能·ai编程
chaofan9801 小时前
如何用 Claude Code 搭建安全、可测、可自动化的 GitHub CI 流程?
运维·人工智能·ci/cd·ai·自动化·github·claude