Torch 加速

loss.item()

  1. 费时
python 复制代码
loss.backward()
loss_item = loss.item()  # todo loss.item() 这个比较费时间  0.2743 秒
  1. 省时
python 复制代码
loss_item = loss.item()   #todo 把它 移到 loss.backward() 前面,这个操作只需要 0.00027 秒
loss.backward()

Index

python 复制代码
d_inv[torch.isinf(d_inv)] = 0.0  # todo 这个超级费时间 大约 0.04秒

Top-k 替换 argsort

python 复制代码
torch.argsort(pc1_sampling_confidence, dim=-1, descending=True)[:, :64] # 费时
torch.topk(pc1_sampling_confidence, 64, dim=-1) # 省时

申明对象

python 复制代码
torch.arange(B, dtype=torch.long, device="cuda") # 省时
torch.arange(B, dtype=torch.long).to("cuda")  # 费时

A.to("cuda") 与 A.cuda() 是一样的时间
相关推荐
Lun3866buzha2 分钟前
轮胎胎面花纹识别与分类:基于solo_r50_fpn模型的实现与优化
人工智能·分类·数据挖掘
没学上了2 分钟前
VLM-单头自注意力机制核心逻辑
人工智能·pytorch·深度学习
zhangdawei8382 分钟前
英伟达GB200,GB300和普通服务器如dell R740xd有什么区别?
运维·服务器·人工智能
Mintopia3 分钟前
意图OS是未来软件形态,它到底解决了什么问题?
人工智能·react native·前端工程化
Mintopia3 分钟前
🤖 AI 决策 + 意图OS:未来软件形态的灵魂共舞
前端·人工智能·react native
万行7 分钟前
机器学习&第一章
人工智能·python·机器学习·flask·计算机组成原理
实战项目7 分钟前
基于PyTorch的卷积神经网络花卉识别系统
人工智能·pytorch·cnn
shangjian0078 分钟前
AI大模型-机器学习-算法-线性回归
人工智能·算法·机器学习
2301_797312269 分钟前
学习java37天
开发语言·python
zuozewei10 分钟前
零基础 | 一文速通 AI 大模型常见术语
人工智能