【pytorch】张量求导4

再再接上文,看到作者有一个关于向量乘矩阵的描述。

经过搜索发现,现在的pytorch已经修复了这一问题,提供了mv()和matmul()两种方式实现矩阵和一维向量的乘积,可以参看这篇文章

经过查阅pytorch的文件,找到了cuda侧的实现,调用的是cuda的gemv操作。

cpp 复制代码
at::cuda::blas::gemv<scalar_t>('n',
      mat.size(0), mat.size(1), alpha, mat.data_ptr<scalar_t>(), mat.stride(1), vec.data_ptr<scalar_t>(),
      vec_stride, beta, result.data_ptr<scalar_t>(), r_stride);
     
相关推荐
hui函数5 分钟前
Flask-WTF表单验证全攻略
后端·python·flask·web·表单验证
二向箔reverse5 分钟前
机器学习算法核心总结
人工智能·算法·机器学习
孔丘闻言25 分钟前
关于 Flask 3.0+的 框架的一些复习差异点
python·adb·flask
ankleless25 分钟前
Python 数据可视化:Matplotlib 与 Seaborn 实战
开发语言·python
dundunmm28 分钟前
【论文阅读】SIMBA: single-cell embedding along with features(2)
论文阅读·人工智能·embedding·生物信息·单细胞·多组学·细胞类型识别
金井PRATHAMA1 小时前
意象框架:连接感知与认知的统一信息结构分析——基于上古汉语同源词意义系统的词源学与认知语言学探索
人工智能·自然语言处理
聚客AI1 小时前
🧠深度解析模型压缩革命:减枝、量化、知识蒸馏
人工智能·深度学习·llm
SHIPKING3931 小时前
【机器学习&深度学习】Ollama、vLLM、LMDeploy对比:选择适合你的 LLM 推理框架
人工智能·深度学习·机器学习
witkey_ak98961 小时前
python 可迭代对象相关知识点
开发语言·python
站大爷IP1 小时前
Python生成器与迭代器:从内存优化到协程调度的深度实践
python