int8

【神经风格迁移：性能】23、边缘艺术革命：树莓派+ONNX实现本地神经风格迁移，单张＜2秒神经风格迁移技术长期以来因计算资源需求高而被限制在云端或高性能GPU上运行。本文将突破这一限制，详细介绍如何在仅售35美元的树莓派上实现实时神经风格迁移。通过ONNX Runtime Tiny优化、INT8量化技术和ARM NEON指令集加速，我们成功将推理时间压缩至2秒以内，同时支持摄像头实时风格迁移。本文不仅提供完整的部署方案，还深入探讨了在资源受限环境下性能与质量的权衡艺术。

常见的GPU性能对比写这篇博客的目的就是想搞清楚英伟达不同显卡之间的性能差异以及移动端GPU的性能达到了英伟达显卡的哪一代，让自己也让大家明白不同显卡的算力差异。所有的数据均从网络搜索，有不正确的地方欢迎批评指正。同一显卡会有一个首次发布，此外还有一系列的迭代升级版本，我们只考虑首次发布版本的性能。鉴于现在的模型推理大多使用int8来进行推理，所以大家可以着重看一下int8算力那一列。

导出 Whisper 模型到 ONNX在语音识别领域，Whisper 模型因其出色的性能和灵活性备受关注。为了在更多平台和环境中部署 Whisper 模型，导出为 ONNX 格式是一个有效的途径。ONNX（Open Neural Network Exchange）是一个开放格式，支持不同的深度学习框架之间的模型互操作性。本指南将详细介绍如何将 Whisper 模型导出为 ONNX 格式，并提供测试模型的步骤。

我是有底线的