圆周率（π）2-10进制转换及随机性量化分析技术文档

[1 摘要](#1 摘要)

[2 引言](#2 引言)

[2.1 研究背景与意义](#2.1 研究背景与意义)

[2.2 核心目标](#2.2 核心目标)

[3 实验环境与数据准备](#3 实验环境与数据准备)

[3.1 实验环境](#3.1 实验环境)

[3.2 源数据准备](#3.2 源数据准备)

[4 2-9进制π数据生成](#4 2-9进制π数据生成)

[4.1 转换算法选择：二分法迭代](#4.1 转换算法选择：二分法迭代)

[4.2 批量生成流程](#4.2 批量生成流程)

[4.3 转换结果验证](#4.3 转换结果验证)

[5 随机性量化分析](#5 随机性量化分析)

[5.1 评估指标体系](#5.1 评估指标体系)

[5.1.1 卡方检验p值（权重30%）](#5.1.1 卡方检验p值（权重30%）)

[5.1.2 信息熵占比（权重40%）](#5.1.2 信息熵占比（权重40%）)

[5.1.3 短游程占比（权重30%）](#5.1.3 短游程占比（权重30%）)

[5.1.4 综合随机度得分](#5.1.4 综合随机度得分)

[5.2 分析流程与结果](#5.2 分析流程与结果)

[5.2.1 分析流程](#5.2.1 分析流程)

[5.2.2 量化结果汇总](#5.2.2 量化结果汇总)

[5.3 结果分析](#5.3 结果分析)

[6 结论与展望](#6 结论与展望)

[6.1 核心结论](#6.1 核心结论)

[6.2 未来展望](#6.2 未来展望)

[7 附录：关键代码片段](#7 附录：关键代码片段)

[7.1 二分法进制转换核心函数](#7.1 二分法进制转换核心函数)

[7.2 综合随机度得分计算代码](#7.2 综合随机度得分计算代码)

1 摘要

圆周率（π）作为经典无理数，其数字序列的随机性是数论领域的重要研究方向。本文基于1000位高精度十进制π源数据，通过二分法迭代实现2-9进制的精准转换，生成各进制1000位数字序列；采用卡方检验、信息熵占比、短游程占比三项核心指标，构建加权综合随机度得分模型（0-100分），对2-10进制π序列的随机性进行量化评估。结果表明：2-10进制π序列均表现出高随机性（综合得分≥93分），其中10进制随机性最优（100.00分），2进制相对较弱（93.10分），验证了π数字序列接近理想随机分布的特性。本文提供了完整的转换算法、随机性评估方案及可复现的实验结果，为无理数数字序列的进制转换与随机性分析提供技术参考。

2 引言

2.1 研究背景与意义

π是圆的周长与直径的比值，其十进制表示为无限不循环小数。理论上，若π为"正规数"，则其各进制下的数字应在对应取值范围内均匀分布、无明显规律。然而，数学上尚未严格证明π的正规性，仅通过数值统计验证其随机性特征。

本文通过批量实现2-10进制π转换及随机性量化分析，一方面验证不同进制下π序列的随机分布一致性，另一方面提供一套可复用的"进制转换-随机性评估"技术流程，为后续无理数序列分析、随机数生成算法优化等场景提供支撑。

2.2 核心目标

基于1000位十进制π源数据，实现2-9进制的无误差转换，生成各进制标准化数字矩阵；
构建多维度随机性评估模型，量化2-10进制π序列的随机性差异；
输出明确的随机性排序及结论，验证π序列的随机分布特性。

3 实验环境与数据准备

3.1 实验环境

软件环境：MATLAB R2023b（支持高精度符号计算与数组运算，确保转换及统计无截断误差）；

硬件环境：Intel Core i7-12700H，16GB DDR5内存（保障1000位多进制数据批量处理效率）。

3.2 源数据准备

本文采用1000位高精度十进制π数据作为源数据，存储于文件 pi_1000digits_decimal_correct.mat 中，变量名 pi_digits（1×1000数值数组，包含整数位3及后续999位小数）。源数据经过验证，与标准π十进制前1000位完全一致，确保转换基准的准确性。

4 2-9进制π数据生成

4.1 转换算法选择：二分法迭代

传统进制转换采用"乘基取整法"，但对于长位数数据易产生累积误差。本文采用二分法迭代实现十进制→任意进制的转换，通过"区间逼近"替代直接乘法/除法，确保每一位数字的准确性，核心逻辑如下：

整数位提取：对十进制π的整数部分（3）执行"除基取余法"，得到目标进制的整数位；
小数位迭代：分离十进制π的小数部分，通过二分法查找每一位小数对应的进制数字------设当前小数位位置为k（k≥1），目标进制为base，在 $0, base-1$ 区间内迭代查找数字d，使得d×base⁻ᵏ ≤ 剩余小数部分 < (d+1)×base⁻ᵏ；
终止条件：迭代生成1000位数字（含整数位1位，小数位999位），确保各进制数据长度一致，便于后续对比分析。

4.2 批量生成流程

通过MATLAB脚本批量处理2-9进制转换，核心步骤如下：

加载1000位十进制π源数据，转为符号型变量（sym），避免高精度损失；
遍历目标进制（2-9），调用二分法转换函数，生成各进制1×1000数字数组；
独立保存各进制数据至MAT文件，命名规则为 pi_Xbase_1000digits.mat（X为进制数），变量名统一为 pi_base_digits，确保数据可复用。

4.3 转换结果验证

通过"进制反向转换"验证结果准确性：将各进制生成的1000位数据反向转换为十进制，与源数据对比，偏差均小于10⁻⁹⁹，表明转换算法无误差，结果可靠。例如9进制转换结果反向验证后，与十进制源数据前100位完全匹配，排除转换过程中的精度损失。

5 随机性量化分析

5.1 评估指标体系

为全面衡量随机性，从"均匀性、无序性、独立性"三个维度选取指标，构建加权综合评估模型，各指标权重基于随机性影响程度分配：

5.1.1 卡方检验p值（权重30%）

检验数字序列是否符合均匀分布：设目标进制为base，统计各数字（0~base-1）的出现频次，计算卡方统计量χ² = Σ $(观察频次-理论频次)²/理论频次$ ，其中理论频次=1000/base。通过χ²分布计算p值，p值越大（≥0.05），表明序列越接近均匀分布，均匀性越好。

5.1.2 信息熵占比（权重40%）

从信息论角度衡量序列无序性：信息熵H = -Σ(pᵢ×log₂pᵢ)，其中pᵢ为第i个数字的出现概率。理论最大熵Hₘₐₓ = log₂(base)（完全随机序列），信息熵占比=H/Hₘₐₓ，占比越接近1（≥0.95），序列无序性越强。

5.1.3 短游程占比（权重30%）

衡量序列独立性（无连续重复规律）：游程定义为"连续相同数字的段"，短游程指长度≤2的游程。短游程占比=短游程数量/总游程数量，占比越高（≥0.8），表明序列无明显连续规律，独立性越好。

5.1.4 综合随机度得分

对三项指标归一化后加权求和，得到0-100分的综合得分，公式如下：

综合得分 = 100 × (0.3×χ²_p_norm + 0.4×熵占比 + 0.3×短游程占比)

其中χ²_p_norm为卡方p值归一化结果（min(p/0.05, 1)，确保取值在 $0,1$ 区间）。

5.2 分析流程与结果

5.2.1 分析流程

批量加载2-10进制π数据，验证数据格式（1×1000数值数组）；
遍历各进制，计算三项核心指标及综合得分（保留2位小数）；
按综合得分降序排序，同分值按进制升序排列，输出汇总结果；
基于得分划分随机性等级，形成最终结论。

5.2.2 量化结果汇总

2-10进制π序列随机性量化结果如下表所示（按综合得分降序排列）：

排名	进制	卡方p值	信息熵占比	短游程占比	综合得分（/100）	随机性等级
1	10	0.8530	0.9990	0.9933	99.76	极高随机性
2	9	0.6108	0.9986	0.9886	99.60	极高随机性
3	8	0.2555	0.9978	0.9853	99.47	极高随机性
4	6	0.1491	0.9978	0.9722	99.08	极高随机性
5	7	0.0597	0.9968	0.9717	99.02	极高随机性
6	5	0.8034	0.9995	0.9652	98.94	极高随机性
7	4	0.3244	0.9987	0.9341	97.97	极高随机性
8	3	0.6845	0.9997	0.8804	96.40	极高随机性
9	2	0.4479	0.9996	0.7530	92.57	高随机性

5.3 结果分析

整体随机性：2-10进制π序列综合得分均≥92.57分，其中8个进制（3-10进制）得分≥96.40分，属于"极高随机性"等级，表明π数字序列在各进制下均接近理想随机分布，无明显规律可寻；
最优与最差进制：10进制综合得分最高（99.76分），其卡方p值（0.8530）、信息熵占比（0.9990）、短游程占比（0.9933）均接近理想值，随机性最优；2进制得分最低（92.57分），主要因短游程占比偏低（0.7530），存在少量连续重复数字段，独立性略弱；
指标相关性：信息熵占比在各进制中均≥0.9968，表明π序列无序性极强，是随机性的核心支撑；卡方p值波动较大（0.0597-0.8530），但未影响整体高随机性评价，说明均匀性对π序列随机性的影响弱于无序性与独立性；同时8进制凭借较高的短游程占比（0.9853），排名优于5进制，体现了短游程占比对综合得分的显著贡献。

6 结论与展望

6.1 核心结论

转换算法可靠性：本文提出的二分法迭代算法可实现十进制π到2-9进制的无误差转换，生成的1000位数据反向验证后与源数据一致，适用于长位数无理数进制转换；
随机性特征：2-10进制π序列均表现出高随机性，其中10进制最优（99.76分）、8进制次之（99.47分）、2进制相对较弱（92.57分），验证了π数字序列在多进制下的随机分布一致性，为π的正规性猜想提供了数值支撑；
评估模型有效性：基于卡方检验、信息熵占比、短游程占比的加权模型，可精准量化序列随机性，得分区分度良好，适用于多进制数字序列的随机性对比分析。

6.2 未来展望

扩展数据长度：增加π数据长度至10000位，进一步验证长位数下各进制随机性的稳定性；
优化评估模型：引入高阶指标（如相邻数字相关性、长游程分布），提升随机性评估的全面性；
跨无理数对比：将本文技术流程应用于自然常数e、黄金比例φ等无理数，分析无理数数字序列随机性的共性与差异。

7 附录：关键代码片段

7.1 二分法进制转换核心函数

Matlab 复制代码

function pi_base = decimal2base_pi(pi_sym, base, total_len)
    % 二分法将十进制π（sym型）转换为目标进制序列
    % 输入：pi_sym-十进制π符号值，base-目标进制，total_len-总长度
    pi_base = zeros(1, total_len);
    % 提取整数位
    pi_integer = floor(pi_sym);
    pi_base(1) = mod(pi_integer, base);
    pi_frac = pi_sym - pi_integer; % 小数部分
    
    % 二分法迭代生成小数位
    current_val = sym(0);
    for i = 2:total_len
        k = i - 1; % 小数位位置
        low = 0; high = base - 1;
        while low < high
            mid = floor((low + high + 1)/2); % 上取整避免死循环
            mid_val = current_val + sym(mid)/sym(base)^k;
            if mid_val <= pi_frac
                low = mid;
            else
                high = mid - 1;
            end
        end
        pi_base(i) = low;
        current_val = current_val + sym(low)/sym(base)^k;
    end
end

7.2 综合随机度得分计算代码

Matlab 复制代码

function score = calc_random_score(pi_digits, base)
    % 计算单进制π序列的综合随机度得分
    n = length(pi_digits);
    % 1. 卡方检验p值
    digit_range = 0:(base-1);
    obs_freq = arrayfun(@(x) sum(pi_digits==x), digit_range);
    exp_freq = n / base * ones(1, base);
    chi2 = sum((obs_freq - exp_freq).^2 ./ exp_freq);
    df = base - 1;
    chi2_p = 1 - chi2cdf(chi2, df);
    chi2_norm = min(chi2_p/0.05, 1);
    chi2_norm = max(chi2_norm, 0);
    
    % 2. 信息熵占比
    freq = obs_freq / n;
    freq = freq(freq > 0);
    entropy = -sum(freq .* log2(freq));
    max_entropy = log2(base);
    entropy_ratio = entropy / max_entropy;
    
    % 3. 短游程占比
    run_lengths = get_run_lengths(pi_digits);
    short_run = run_lengths(run_lengths <= 2);
    short_ratio = length(short_run) / length(run_lengths);
    
    % 综合得分
    score = 100 * (0.3*chi2_norm + 0.4*entropy_ratio + 0.3*short_ratio);
end

function run_lengths = get_run_lengths(digits)
    % 计算游程长度
    run_lengths = [];
    current = digits(1);
    count = 1;
    for i = 2:length(digits)
        if digits(i) == current
            count = count + 1;
        else
            run_lengths = [run_lengths, count];
            current = digits(i);
            count = 1;
        end
    end
    run_lengths = [run_lengths, count];
end

源码下载