两种常见的C语言实现64位无符号整数乘以64位无符号整数的实现方法

以下是两种常见的C语言实现64位无符号整数乘以64位无符号整数的实现方法,分别给出可移植版本和现代编译器优化版本:

方法1:可移植版本(通用标准C)

c 复制代码
#include <stdint.h>

typedef struct {
    uint64_t lo; // 低64位
    uint64_t hi; // 高64位
} uint128_t;

uint128_t mul64x64(uint64_t a, uint64_t b)
{
    // 将64位数拆分为高低各32位
    const uint64_t a_lo = (uint64_t)(uint32_t)a;
    const uint64_t a_hi = a >> 32;
    const uint64_t b_lo = (uint64_t)(uint32_t)b;
    const uint64_t b_hi = b >> 32;

    // 计算部分积
    const uint64_t p0 = a_lo * b_lo;
    const uint64_t p1 = a_lo * b_hi;
    const uint64_t p2 = a_hi * b_lo;
    const uint64_t p3 = a_hi * b_hi;

    // 计算中间结果
    const uint64_t mid = p1 + (p0 >> 32);
    const uint64_t carry = (mid < p1) ? 1 : 0; // 处理溢出进位

    const uint64_t mid2 = p2 + (mid & 0xFFFFFFFFULL);
    const uint64_t carry2 = (mid2 < p2) ? 1 : 0; // 处理溢出进位

    // 组装最终结果
    return (uint128_t){
        .lo = (mid2 << 32) | (p0 & 0xFFFFFFFFULL),
        .hi = p3 + (mid >> 32) + (mid2 >> 32) + carry + carry2
    };
}在这里插入代码片

方法2:编译器优化版本(GCC/Clang)

c 复制代码
#include <stdint.h>

typedef unsigned __int128 uint128_t; // GCC/Clang扩展类型

uint128_t mul64x64(uint64_t a, uint64_t b)
{
    return (uint128_t)a * (uint128_t)b; // 直接使用内置128位类型
}

两种方案的对比:

特性 通用标准C版本 编译器优化版本

可移植性 符合C99标准,任何编译器可用 仅限GCC/Clang等支持编译器

性能 需要手动处理进位,效率较低 编译器生成最优汇编

代码复杂度 需要显式处理所有进位逻辑 单行代码实现

最大输入 0xFFFFFFFFFFFFFFFF * 0xFFFFFFFFFFFFFFFF 同上

输出精度 完整128位结果 同上

使用示例:

c 复制代码
#include <stdio.h>

int main()
{
    // 测试用例:0xFFFFFFFFFFFFFFFF * 0xFFFFFFFFFFFFFFFF
    const uint64_t a = 0xFFFFFFFFFFFFFFFF;
    const uint64_t b = 0xFFFFFFFFFFFFFFFF;

    // 方法1使用
    uint128_t result1 = mul64x64(a, b);
    printf("通用版结果: 0x%016lX%016lX\n", result1.hi, result1.lo);
    printf("通用版结果: 0x%016llX%016llX\n", result1.hi, result1.lo);

    // 方法2使用
    uint128_t result2 = (uint128_t)a * b;
    printf("优化版结果: 0x%016lX%016lX\n", 
           (uint64_t)(result2 >> 64), 
           (uint64_t)result2);

    return 0;
}

输出结果:

c 复制代码
通用版结果: 0xFFFFFFFFFFFFFFFE0000000000000001
优化版结果: 0xFFFFFFFFFFFFFFFE0000000000000001

建议根据实际需求选择:

如果需要最佳性能且使用支持__int128的编译器,选择方法2

如果需要最大可移植性,选择方法1

如果要处理有符号数,需要额外处理符号位(可用类似方法扩展)

相关推荐
xiaobobo333013 分钟前
C语言中关于普通变量和指针变量、结构体包含子结构体或包含结构体指针的一些思考
c语言·开发语言·结构体指针
数据智能老司机1 小时前
图算法趣味学——最大流算法
数据结构·算法·云计算
秋难降2 小时前
【数据结构与算法】———深度优先:“死磕 + 回头” 的艺术
数据结构·python·算法
数据智能老司机2 小时前
图算法趣味学——图着色
数据结构·算法·云计算
数据智能老司机2 小时前
图算法趣味学——启发式引导搜索
数据结构·算法·云计算
时光の尘2 小时前
ESP32入门开发·VScode空白项目搭建·点亮一颗LED灯
c语言·ide·vscode·freertos·led·esp32-s3·esp32-idf
John.Lewis2 小时前
数据结构初阶(8)二叉树的顺序结构 && 堆
c语言·数据结构·算法
SimonSkywalke2 小时前
基于知识图谱增强的RAG系统阅读笔记(七)GraphRAG实现(基于小说诛仙)(一)
算法
程序猿编码3 小时前
基于LLVM的memcpy静态分析工具:设计思路与原理解析(C/C++代码实现)
c语言·c++·静态分析·llvm·llvm ir
再睡一夏就好3 小时前
【排序算法】④堆排序
c语言·数据结构·c++·笔记·算法·排序算法