【pytorch】张量求导4

再再接上文,看到作者有一个关于向量乘矩阵的描述。

经过搜索发现,现在的pytorch已经修复了这一问题,提供了mv()和matmul()两种方式实现矩阵和一维向量的乘积,可以参看这篇文章

经过查阅pytorch的文件,找到了cuda侧的实现,调用的是cuda的gemv操作。

cpp 复制代码
at::cuda::blas::gemv<scalar_t>('n',
      mat.size(0), mat.size(1), alpha, mat.data_ptr<scalar_t>(), mat.stride(1), vec.data_ptr<scalar_t>(),
      vec_stride, beta, result.data_ptr<scalar_t>(), r_stride);
     
相关推荐
胡斌附体3 分钟前
离线docker安装jupyter(python网页版编辑器)
python·docker·jupyter·image·tar·save
java1234_小锋1 小时前
TensorFlow2 Python深度学习 - TensorFlow2框架入门 - 使用Keras实现逻辑回归
python·深度学习·tensorflow·tensorflow2
java1234_小锋1 小时前
TensorFlow2 Python深度学习 - TensorFlow2框架入门 - Sequential顺序模型
python·深度学习·tensorflow·tensorflow2
不惑_3 小时前
【征文计划】AI+AR生态新未来,Rokid核心技术实战解析
人工智能·机器学习
小关会打代码3 小时前
深度学习之YOLO系列了解基本知识
人工智能·深度学习·yolo
振鹏Dong5 小时前
依托 <AI 原生应用架构白皮书>,看 AI 原生应用的发展与实践
人工智能
雨夜的星光6 小时前
Python JSON处理:load/loads/dump/dumps全解析
开发语言·python·json
智行众维6 小时前
自动驾驶的“虚拟驾校”如何炼成?
人工智能·自动驾驶·汽车·智能驾驶·智能网联汽车·智能驾驶仿真测试·智驾系统
空白到白7 小时前
NLP-注意力机制
人工智能·自然语言处理
fen_fen7 小时前
Java打包时,不将本地Jar打包到项目的最终 JAR 中
开发语言·python·pycharm