两种常见的C语言实现64位无符号整数乘以64位无符号整数的实现方法

以下是两种常见的C语言实现64位无符号整数乘以64位无符号整数的实现方法,分别给出可移植版本和现代编译器优化版本:

方法1:可移植版本(通用标准C)

c 复制代码
#include <stdint.h>

typedef struct {
    uint64_t lo; // 低64位
    uint64_t hi; // 高64位
} uint128_t;

uint128_t mul64x64(uint64_t a, uint64_t b)
{
    // 将64位数拆分为高低各32位
    const uint64_t a_lo = (uint64_t)(uint32_t)a;
    const uint64_t a_hi = a >> 32;
    const uint64_t b_lo = (uint64_t)(uint32_t)b;
    const uint64_t b_hi = b >> 32;

    // 计算部分积
    const uint64_t p0 = a_lo * b_lo;
    const uint64_t p1 = a_lo * b_hi;
    const uint64_t p2 = a_hi * b_lo;
    const uint64_t p3 = a_hi * b_hi;

    // 计算中间结果
    const uint64_t mid = p1 + (p0 >> 32);
    const uint64_t carry = (mid < p1) ? 1 : 0; // 处理溢出进位

    const uint64_t mid2 = p2 + (mid & 0xFFFFFFFFULL);
    const uint64_t carry2 = (mid2 < p2) ? 1 : 0; // 处理溢出进位

    // 组装最终结果
    return (uint128_t){
        .lo = (mid2 << 32) | (p0 & 0xFFFFFFFFULL),
        .hi = p3 + (mid >> 32) + (mid2 >> 32) + carry + carry2
    };
}在这里插入代码片

方法2:编译器优化版本(GCC/Clang)

c 复制代码
#include <stdint.h>

typedef unsigned __int128 uint128_t; // GCC/Clang扩展类型

uint128_t mul64x64(uint64_t a, uint64_t b)
{
    return (uint128_t)a * (uint128_t)b; // 直接使用内置128位类型
}

两种方案的对比:

特性 通用标准C版本 编译器优化版本

可移植性 符合C99标准,任何编译器可用 仅限GCC/Clang等支持编译器

性能 需要手动处理进位,效率较低 编译器生成最优汇编

代码复杂度 需要显式处理所有进位逻辑 单行代码实现

最大输入 0xFFFFFFFFFFFFFFFF * 0xFFFFFFFFFFFFFFFF 同上

输出精度 完整128位结果 同上

使用示例:

c 复制代码
#include <stdio.h>

int main()
{
    // 测试用例:0xFFFFFFFFFFFFFFFF * 0xFFFFFFFFFFFFFFFF
    const uint64_t a = 0xFFFFFFFFFFFFFFFF;
    const uint64_t b = 0xFFFFFFFFFFFFFFFF;

    // 方法1使用
    uint128_t result1 = mul64x64(a, b);
    printf("通用版结果: 0x%016lX%016lX\n", result1.hi, result1.lo);
    printf("通用版结果: 0x%016llX%016llX\n", result1.hi, result1.lo);

    // 方法2使用
    uint128_t result2 = (uint128_t)a * b;
    printf("优化版结果: 0x%016lX%016lX\n", 
           (uint64_t)(result2 >> 64), 
           (uint64_t)result2);

    return 0;
}

输出结果:

c 复制代码
通用版结果: 0xFFFFFFFFFFFFFFFE0000000000000001
优化版结果: 0xFFFFFFFFFFFFFFFE0000000000000001

建议根据实际需求选择:

如果需要最佳性能且使用支持__int128的编译器,选择方法2

如果需要最大可移植性,选择方法1

如果要处理有符号数,需要额外处理符号位(可用类似方法扩展)

相关推荐
帅帅爱数学1 小时前
DeepMimic论文详细解析:基于示例引导的深度强化学习实现物理仿真角色技能
算法·强化学习
啊?啊?1 小时前
C/C++练手小项目之倒计时与下载进度条模拟
c语言·开发语言·c++
IT成长日记1 小时前
【LVS入门宝典】LVS调度算法轮询(RR)深度解析:从原理到实战的公平调度之道
算法·lvs·rr·轮询调度算法
NAGNIP2 小时前
一文搞懂量化、剪枝和知识蒸馏都是什么?
算法
点云SLAM2 小时前
GTSAM 中自定义因子(Custom Factor)的详解和实战示例
算法·机器人·slam·后端优化·gtsam·gtsam自定义因子·因子图
萘柰奈3 小时前
LeetCode刷题记录----62.不同路径(Medium)
算法·leetcode·职场和发展
阳光明媚sunny3 小时前
爬楼梯算法java实现
算法·动态规划
贝塔实验室3 小时前
LDPC码的概念
科技·学习·程序人生·算法·学习方法·程序员创富·改行学it
weixin_307779133 小时前
矩形势阱(V(x) = -H for |x|≤L)的束缚态能级求解与宇称分类
算法
MMjeaty4 小时前
数据结构——栈和队列
数据结构·算法