pytorch+cpu版本对Intel Ultra 9 275HX性能的影响

最近在用Intel Ultra 9 275HX跑RL,发现其运行效率很慢,于是对其性能进行了测试。U9 275HX,是8P+16E,24线程。测试过程中发现,只用8P而限制E核的使用,性能会有所提升。且pytorch的版本好对于8P的加载,起着关键的作用。

仅用 8 个 P 核执行 PyTorch 计算,禁用 E 核参与,代码如下

import os

必须在import torch之前设置,否则不生效

os.environ["OMP_NUM_THREADS"] = "8" # 严格等于P核数量

os.environ["MKL_NUM_THREADS"] = "8" # MKL线程数也设置为8,避免过度线程化

优化线程亲和性,绑定连续P核,避免跨核/跨NUMA调度

os.environ["KMP_AFFINITY"] = "granularity=fine,compact,1,0"

os.environ["KMP_BLOCKTIME"] = "1" # 减少OpenMP线程休眠,提升响应速度

import torch

1.pytorch2.4.1+cpu

运行时发现,它启用的是2P+6E全开

2.pytorch2.9.0+cpu

正常启用的是8P全开

这也告诉我们,在安装包时,也要考虑对cpu或者gpu架构的支持。如5060TI仅支持cuda12.8+.

相关推荐
TechWayfarer10 小时前
IP归属地API实战指南:用IP数据云解析日志挖掘用户地域分布
大数据·开发语言·网络·python·tcp/ip
Cloud_Shy61810 小时前
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第十一章 Python 包跟踪器 中篇)
数据库·python·sql·数据分析·excel·web
ASKED_201910 小时前
ReAct 智能体的失败处理与改进机制:从 Demo 到工业级 Agent 的关键一步
人工智能·架构
带娃的IT创业者10 小时前
Anthropic收购Stainless:AI Agent时代的连接革命
人工智能·ai agent·anthropic·mcp·收购·stainless
X54先生(人文科技)10 小时前
《元创力》叙事宇宙架构蓝图·官方完整版正式档案
人工智能·架构·ai写作·开源协议
XD74297163610 小时前
科技早报|2026年5月19日:AI 编码开始补 SDK、API 和审计链路
人工智能·开发者工具·科技早报
海上彼尚10 小时前
Nodejs也能写Agent - 3.基础篇 - Tools 与 Tool Calling
前端·人工智能·后端·node.js
PPIO派欧云10 小时前
PPIO参展2026上海信息消费节,全栈式AI云产品亮相
大数据·人工智能
端平入洛10 小时前
Python 可变对象与引用穿透:为什么改了"里面的东西"外面也变了?
python
大模型推理10 小时前
Nano-vLLM 源码解读 - 10. Context 元数据
人工智能