【pytorch】张量求导4

再再接上文,看到作者有一个关于向量乘矩阵的描述。

经过搜索发现,现在的pytorch已经修复了这一问题,提供了mv()和matmul()两种方式实现矩阵和一维向量的乘积,可以参看这篇文章

经过查阅pytorch的文件,找到了cuda侧的实现,调用的是cuda的gemv操作。

cpp 复制代码
at::cuda::blas::gemv<scalar_t>('n',
      mat.size(0), mat.size(1), alpha, mat.data_ptr<scalar_t>(), mat.stride(1), vec.data_ptr<scalar_t>(),
      vec_stride, beta, result.data_ptr<scalar_t>(), r_stride);
     
相关推荐
三万棵雪松几秒前
【AI小智硬件程序(四)】
人工智能·嵌入式·esp32·ai小智
TDengine (老段)5 分钟前
TDengine Python 连接器入门指南
大数据·数据库·python·物联网·时序数据库·tdengine·涛思数据
亚里随笔6 分钟前
GenEnv:让AI智能体像人一样在_游戏_中成长
人工智能·游戏·llm·rl·agentic
少林码僧15 分钟前
2.29 XGBoost、LightGBM、CatBoost对比:三大梯度提升框架选型指南
人工智能·机器学习·ai·数据挖掘·数据分析·回归
喝拿铁写前端17 分钟前
当 AI 会写代码之后,我们应该怎么“管”它?
前端·人工智能
春日见19 分钟前
控制算法:PP(纯跟踪)算法
linux·人工智能·驱动开发·算法·机器学习
沫儿笙28 分钟前
ABB焊接机器人混合气体节气方案
人工智能·机器人
田里的水稻30 分钟前
C++_python_相互之间的包含调用方法
c++·chrome·python
余俊晖30 分钟前
多页文档理解强化学习设计思路:DocR1奖励函数设计与数据构建思路
人工智能·语言模型·自然语言处理
Yeats_Liao33 分钟前
MindSpore开发之路(二十六):系列总结与学习路径展望
人工智能·深度学习·学习·机器学习