Torch 加速

loss.item()

  1. 费时
python 复制代码
loss.backward()
loss_item = loss.item()  # todo loss.item() 这个比较费时间  0.2743 秒
  1. 省时
python 复制代码
loss_item = loss.item()   #todo 把它 移到 loss.backward() 前面,这个操作只需要 0.00027 秒
loss.backward()

Index

python 复制代码
d_inv[torch.isinf(d_inv)] = 0.0  # todo 这个超级费时间 大约 0.04秒

Top-k 替换 argsort

python 复制代码
torch.argsort(pc1_sampling_confidence, dim=-1, descending=True)[:, :64] # 费时
torch.topk(pc1_sampling_confidence, 64, dim=-1) # 省时

申明对象

python 复制代码
torch.arange(B, dtype=torch.long, device="cuda") # 省时
torch.arange(B, dtype=torch.long).to("cuda")  # 费时

A.to("cuda") 与 A.cuda() 是一样的时间
相关推荐
a1504638 分钟前
人工智能——图像梯度处理、边缘检测、绘制图像轮廓、凸包特征检测
人工智能·深度学习·计算机视觉
荼蘼13 分钟前
基于 KNN 算法的手写数字识别项目实践
人工智能·算法·机器学习
赵英英俊15 分钟前
Python day26
开发语言·python
你怎么知道我是队长15 分钟前
python---eval函数
开发语言·javascript·python
wei_shuo24 分钟前
亚马逊云科技 EC2 部署 Dify,集成 Amazon Bedrock 构建生成式 AI 应用
人工智能·amazon·amazon bedrock
ppo9229 分钟前
MCP简单应用:使用SpringAI + Cline + DeepSeek实现AI创建文件并写入内容
人工智能·后端
Rockson39 分钟前
期货实时行情接口接入教程
python·api
云卓SKYDROID39 分钟前
无人机速度模块技术要点分析
人工智能·无人机·科普·高科技·云卓科技
UQI-LIUWJ2 小时前
论文笔记:Tuning Language Models by Proxy
论文阅读·人工智能·语言模型
awonw2 小时前
[python][基础]Flask 技术栈
开发语言·python·flask