拉力测试cuda pytorch 把 4070显卡拉满

复制代码
import torch
import time


def stress_test_gpu(matrix_size=16384, duration=300):
    """
    对GPU进行压力测试,通过持续的矩阵乘法来最大化GPU利用率

    参数:
        matrix_size: 矩阵维度大小,增大可提高计算复杂度
        duration: 测试持续时间(秒)
    """
    # 检查CUDA是否可用
    if not torch.cuda.is_available():
        print("CUDA不可用,无法进行GPU压力测试!")
        return

    # 获取GPU设备
    device = torch.device("cuda:0")
    print(f"使用GPU: {torch.cuda.get_device_name(device)}")

    # 创建大型矩阵并移到GPU
    print(f"正在创建 {matrix_size}x{matrix_size} 的矩阵...")
    a = torch.randn(matrix_size, matrix_size, device=device)
    b = torch.randn(matrix_size, matrix_size, device=device)

    # 预热GPU
    print("预热GPU中...")
    for _ in range(3):
        c = torch.matmul(a, b)
    torch.cuda.synchronize()

    # 开始压力测试
    print(f"开始GPU压力测试,持续 {duration} 秒...")
    start_time = time.time()
    iterations = 0

    try:
        while time.time() - start_time < duration:
            # 执行矩阵乘法(计算密集型操作)
            c = torch.matmul(a, b)

            # 同步设备以确保计算完成
            torch.cuda.synchronize()
            iterations += 1

            # 每10秒打印一次进度
            if iterations % 10 == 0:
                elapsed = time.time() - start_time
                print(f"已运行 {elapsed:.1f}s / {duration}s,迭代次数: {iterations}")

    except KeyboardInterrupt:
        print("测试被用户中断")

    finally:
        # 清理资源
        del a, b, c
        torch.cuda.empty_cache()

        # 计算性能指标
        elapsed = time.time() - start_time
        print(f"\n压力测试完成!")
        print(f"总运行时间: {elapsed:.2f} 秒")
        print(f"总迭代次数: {iterations}")
        print(f"平均每秒迭代: {iterations / elapsed:.2f}")


if __name__ == "__main__":
    # 可调整矩阵大小以平衡性能和显存使用
    # 16384x16384 矩阵约占用2GB显存 (4070有12GB显存)
    stress_test_gpu(matrix_size=16384, duration=300)
相关推荐
:mnong7 分钟前
AI 编程理论与实践 — 课程大纲
人工智能
hsjcjh8 分钟前
多模态长文本协同:用Gemini 3.1 Pro镜像官网破解复杂办公场景的效率困局(国内实测方案)
python
Luca_kill11 分钟前
深度解析 DeerFlow:字节跳动开源的长时程 AI 超级智能体架构
人工智能·智能体·大模型应用·ai架构·deerflow
凯瑟琳.奥古斯特14 分钟前
SQLAlchemy核心功能解析
开发语言·python·flask
PNP Robotics22 分钟前
领军军者|PNP机器人包文涛:以具身智能定义机器人的“生命直觉”
人工智能·深度学习·学习·机器学习·机器人
卷Java26 分钟前
GPTQ vs AWQ vs GGUF:模型量化工具横向测评
开发语言·windows·python
stereohomology27 分钟前
2026年人工智能技术趋势浅度解析
人工智能
2601_9583205735 分钟前
【小白易懂版】OpenClaw 飞书机器人绑定配置详细教程(含安装包)
人工智能·机器人·飞书·open claw·小龙虾·open claw安装
AI创界者41 分钟前
《2026 视觉革命:深度测评 GPT-Image-2,基于 DMXAPI 实现 4K 超分与批量生图实战》
人工智能
云上码厂43 分钟前
2023年之前物理信息神经网络PINN papers
人工智能·深度学习·神经网络