第五届大数据经济与数字化管理国际学术会议（BDEDM 2026）

重要信息

官网： https://ais.cn/u/2MzI7b

**时间：**2026年1月9-11日

地点：中国广州

征稿主题

一、大数据经济与数字化管理的技术体系架构

大数据经济以数据为核心生产要素，数字化管理则是实现数据价值落地的关键手段，二者融合形成 "数据采集 - 数据治理 - 分析建模 - 决策落地 - 价值评估" 的完整技术体系，覆盖金融、零售、制造、政务等核心经济领域。以下为各环节核心技术与应用场景的对应关系：

技术环节	核心技术方向	典型经济管理场景	技术核心目标
数据采集层	多源数据爬虫、IoT 数据接入、日志采集、API 集成	零售用户行为采集、制造业产线数据采集	全维度获取经济活动中的结构化 / 非结构化数据
数据治理层	数据清洗、数据标准化、数据脱敏、元数据管理	金融客户数据合规治理、政务数据融合	保障数据质量、合规性与可复用性
分析建模层	机器学习、时间序列分析、关联规则挖掘、因果推断	消费趋势预测、供应链风险预警	从数据中提取经济规律与管理决策依据
决策落地层	数字化决策系统、RPA 流程自动化、智能调度	企业库存智能管理、政务政策精准推送	将分析结果转化为可执行的管理动作
价值评估层	数据价值量化、ROI 分析、效果归因分析	营销活动效果评估、数据资产定价	衡量数据驱动决策的经济价值与管理效率

二、数据采集层：多源经济数据采集与预处理

经济场景中的数据具有 "多源、异构、高噪声" 特征，高效的采集与预处理是数字化管理的基础。以下以零售行业用户行为数据采集为例，实现基于 Python 的多源数据爬取与清洗。

2.1 技术环境与依赖

核心工具：requests（API / 网页数据爬取）、pandas（数据处理）、re（正则清洗）、json（结构化数据解析）
适用场景：电商平台用户浏览、下单、支付等行为数据采集

bash

运行

复制代码

# 安装依赖
pip install requests pandas numpy

2.2 Python 实现多源经济数据采集与清洗

python

运行

复制代码

import requests
import pandas as pd
import re
import json
import numpy as np
from datetime import datetime

# 1. 模拟电商API数据采集（用户行为）
def crawl_ecommerce_api(api_url, headers=None):
    """爬取电商平台用户行为API数据"""
    try:
        response = requests.get(api_url, headers=headers, timeout=10)
        if response.status_code == 200:
            return response.json()
        else:
            print(f"API请求失败，状态码：{response.status_code}")
            return None
    except Exception as e:
        print(f"API爬取异常：{str(e)}")
        return None

# 2. 网页数据采集（商品评论）
def crawl_comment_html(html_url):
    """爬取商品评论网页数据（模拟非结构化数据）"""
    try:
        response = requests.get(html_url, timeout=10)
        if response.status_code == 200:
            # 正则提取评论内容（模拟非结构化数据解析）
            comment_pattern = re.compile(r'<div class="comment-content">(.*?)</div>')
            comments = comment_pattern.findall(response.text)
            # 提取评论时间
            time_pattern = re.compile(r'<span class="comment-time">(.*?)</span>')
            comment_times = time_pattern.findall(response.text)
            return [{"comment": c, "time": t} for c, t in zip(comments, comment_times)]
        else:
            print(f"网页请求失败，状态码：{response.status_code}")
            return None
    except Exception as e:
        print(f"网页爬取异常：{str(e)}")
        return None

# 3. 数据清洗函数
def clean_economic_data(raw_df):
    """清洗经济数据：缺失值、异常值、格式标准化"""
    # 复制数据避免原数据修改
    df = raw_df.copy()
    
    # 1. 处理缺失值：数值型填充均值，类别型填充众数
    for col in df.columns:
        if df[col].dtype in ['int64', 'float64']:
            df[col].fillna(df[col].mean(), inplace=True)
        else:
            df[col].fillna(df[col].mode()[0], inplace=True)
    
    # 2. 处理异常值（数值型字段，3σ原则）
    numeric_cols = df.select_dtypes(include=['int64', 'float64']).columns
    for col in numeric_cols:
        mean = df[col].mean()
        std = df[col].std()
        # 筛选正常范围数据
        df = df[(df[col] >= mean - 3*std) & (df[col] <= mean + 3*std)]
    
    # 3. 时间格式标准化
    if 'time' in df.columns:
        df['time'] = pd.to_datetime(df['time'], errors='coerce')
    
    # 4. 去除重复数据
    df.drop_duplicates(inplace=True)
    
    return df

# 主程序
if __name__ == "__main__":
    # 模拟API数据（用户行为）
    mock_api_data = {
        "user_behavior": [
            {"user_id": 1001, "action": "browse", "product_id": 2001, "time": "2026-01-01 10:05:30", "amount": 0},
            {"user_id": 1001, "action": "order", "product_id": 2001, "time": "2026-01-01 10:10:20", "amount": 199.9},
            {"user_id": 1002, "action": "browse", "product_id": 2002, "time": "", "amount": 0},  # 缺失时间
            {"user_id": 1003, "action": "pay", "product_id": 2003, "time": "2026-01-01 11:20:15", "amount": 99999},  # 异常金额
            {"user_id": 1001, "action": "browse", "product_id": 2001, "time": "2026-01-01 10:05:30", "amount": 0}  # 重复数据
        ]
    }
    
    # 转换为DataFrame
    raw_df = pd.DataFrame(mock_api_data["user_behavior"])
    print("原始数据：")
    print(raw_df)
    
    # 数据清洗
    cleaned_df = clean_economic_data(raw_df)
    print("\n清洗后数据：")
    print(cleaned_df)
    
    # 输出数据统计信息（数字化管理基础）
    print("\n数据统计摘要：")
    print(f"用户数：{cleaned_df['user_id'].nunique()}")
    print(f"订单总金额：{cleaned_df[cleaned_df['action']=='order']['amount'].sum():.2f}")
    print(f"数据时间范围：{cleaned_df['time'].min()} 至 {cleaned_df['time'].max()}")

2.3 代码说明

多源采集：模拟电商 API 结构化数据（用户行为）和网页非结构化数据（商品评论）的采集逻辑，适配经济场景中多类型数据来源；
数据清洗：覆盖缺失值填充、异常值过滤（3σ 原则）、时间格式标准化、重复值去除四大核心环节，保障经济数据的可用性；
统计分析：输出用户数、订单金额等核心指标，为零售数字化管理提供基础数据支撑。

三、分析建模层：时间序列分析预测经济趋势

时间序列分析是大数据经济的核心分析方法，可用于预测商品销量、股价走势、消费指数等经济指标，为数字化管理决策提供依据。以下以零售销量预测为例，实现基于 ARIMA 模型的时间序列分析。

3.1 技术原理与适用场景

ARIMA 模型：自回归积分滑动平均模型，适用于平稳 / 非平稳时间序列预测，核心参数 (p,d,q) 分别对应自回归阶数、差分阶数、滑动平均阶数；
适用场景：月度销量预测、季度经济指标预测、供应链库存规划。

3.2 Python 实现销量预测与管理决策

python

运行

复制代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.tsa.stattools import adfuller
from sklearn.metrics import mean_absolute_error, mean_squared_error

# 禁用图片显示（适配无图要求），仅输出数值结果
plt.switch_backend('Agg')

# 1. 生成模拟零售销量数据（2025年1-12月）
def generate_sales_data():
    """生成带趋势+季节性的销量时间序列数据"""
    dates = pd.date_range(start='2025-01-01', end='2025-12-31', freq='M')
    # 基础趋势 + 季节性波动 + 随机噪声
    base_trend = np.linspace(1000, 1500, len(dates))
    seasonality = 100 * np.sin(np.linspace(0, 2*np.pi, len(dates)))
    noise = np.random.normal(0, 50, len(dates))
    sales = base_trend + seasonality + noise
    return pd.DataFrame({"date": dates, "sales": sales})

# 2. 平稳性检验（ADF检验）
def adf_test(series):
    """ADF检验判断序列是否平稳"""
    result = adfuller(series)
    print('ADF统计量:', result[0])
    print('p值:', result[1])
    print('临界值:', result[4])
    if result[1] <= 0.05:
        print("序列平稳（p≤0.05）")
        return True
    else:
        print("序列非平稳（p>0.05）")
        return False

# 3. ARIMA模型训练与预测
def arima_sales_prediction(sales_series, order=(1,1,1), forecast_steps=3):
    """
    训练ARIMA模型并预测未来销量
    :param sales_series: 销量时间序列
    :param order: ARIMA参数(p,d,q)
    :param forecast_steps: 预测未来步数（如3个月）
    :return: 预测结果、模型评估指标
    """
    # 划分训练集（80%）和测试集（20%）
    train_size = int(len(sales_series) * 0.8)
    train, test = sales_series[:train_size], sales_series[train_size:]
    
    # 训练模型
    model = ARIMA(train, order=order)
    model_fit = model.fit()
    
    # 测试集预测
    test_pred = model_fit.predict(start=len(train), end=len(train)+len(test)-1, typ='levels')
    
    # 模型评估
    mae = mean_absolute_error(test, test_pred)
    rmse = np.sqrt(mean_squared_error(test, test_pred))
    mape = np.mean(np.abs((test - test_pred) / test)) * 100  # 平均绝对百分比误差
    
    # 未来销量预测
    future_pred = model_fit.predict(start=len(sales_series), end=len(sales_series)+forecast_steps-1, typ='levels')
    
    return {
        "test_actual": test,
        "test_pred": test_pred,
        "future_pred": future_pred,
        "mae": mae,
        "rmse": rmse,
        "mape": mape
    }

# 主程序
if __name__ == "__main__":
    # 生成销量数据
    sales_df = generate_sales_data()
    sales_series = sales_df.set_index('date')['sales']
    print("2025年月度销量数据：")
    print(sales_series)
    
    # 平稳性检验
    print("\n=== 平稳性检验结果 ===")
    is_stationary = adf_test(sales_series)
    # 若非平稳则差分（此处d=1）
    if not is_stationary:
        sales_series = sales_series.diff().dropna()
        print("差分后平稳性检验：")
        adf_test(sales_series)
    
    # ARIMA模型预测
    print("\n=== ARIMA模型预测结果 ===")
    pred_result = arima_sales_prediction(sales_series, order=(1,1,1), forecast_steps=3)
    
    # 输出模型评估指标
    print(f"模型评估 - MAE：{pred_result['mae']:.2f}")
    print(f"模型评估 - RMSE：{pred_result['rmse']:.2f}")
    print(f"模型评估 - MAPE：{pred_result['mape']:.2f}%")
    
    # 输出测试集预测结果
    print("\n测试集实际销量 vs 预测销量：")
    test_result = pd.DataFrame({
        "actual": pred_result['test_actual'].values,
        "predicted": pred_result['test_pred'].values
    }, index=pred_result['test_actual'].index)
    print(test_result)
    
    # 输出未来3个月销量预测（数字化管理决策依据）
    print("\n2026年Q1销量预测：")
    future_dates = pd.date_range(start='2026-01-31', periods=3, freq='M')
    future_result = pd.DataFrame({
        "date": future_dates,
        "predicted_sales": pred_result['future_pred'].values
    })
    print(future_result)
    
    # 数字化管理建议
    avg_future_sales = future_result['predicted_sales'].mean()
    if avg_future_sales > sales_series.mean():
        print("\n管理决策建议：2026年Q1销量预计上涨，建议提前增加库存、扩充供应链产能")
    else:
        print("\n管理决策建议：2026年Q1销量预计持平/下降，建议优化库存结构、降低备货成本")

3.3 代码说明

数据生成：模拟带趋势 + 季节性的零售销量数据，贴合真实经济场景的时间序列特征；
平稳性检验：通过 ADF 检验判断序列平稳性，非平稳序列进行差分处理（ARIMA 核心步骤）；
模型预测：划分训练 / 测试集，训练 ARIMA 模型并评估（MAE/RMSE/MAPE），预测未来 3 个月销量；
决策输出：基于预测结果给出库存、供应链管理建议，体现 "数据分析→管理决策" 的落地逻辑。

四、决策落地层：RPA 自动化实现数字化管理流程

机器人流程自动化（RPA）是数字化管理的核心落地手段，可替代人工完成重复、规则化的经济管理流程（如财务对账、订单审核、数据上报）。以下实现基于 Python 的轻量级 RPA 流程，模拟电商订单审核自动化。

4.1 RPA 核心逻辑与场景

核心逻辑：基于规则引擎，自动审核订单数据（如金额阈值、用户信用、库存状态），输出审核结果；
适用场景：电商订单自动审核、财务发票自动校验、政务数据自动上报。

4.2 Python 实现订单审核 RPA

python

运行

复制代码

import pandas as pd
import json
import time

# 1. 加载订单数据与规则配置
def load_order_data_and_rules():
    """加载订单数据和审核规则"""
    # 模拟订单数据
    orders = [
        {"order_id": 3001, "user_id": 1001, "amount": 199.9, "user_credit": 950, "stock": 100},
        {"order_id": 3002, "user_id": 1002, "amount": 5999.9, "user_credit": 580, "stock": 0},
        {"order_id": 3003, "user_id": 1003, "amount": 299.9, "user_credit": 880, "stock": 50},
        {"order_id": 3004, "user_id": 1004, "amount": 9999.9, "user_credit": 900, "stock": 80},
        {"order_id": 3005, "user_id": 1005, "amount": 99.9, "user_credit": 650, "stock": 200}
    ]
    # 审核规则配置（数字化管理规则）
    rules = {
        "credit_threshold": 700,  # 用户信用分阈值
        "amount_threshold_high": 8000,  # 高金额订单阈值（需人工复核）
        "stock_threshold": 0,  # 库存阈值（库存≤0拒绝）
        "auto_approve": ["credit≥threshold", "stock>threshold", "amount<threshold_high"]  # 自动通过条件
    }
    return pd.DataFrame(orders), rules

# 2. RPA规则引擎：订单审核
def rpa_order_audit(order_df, rules):
    """自动化订单审核规则引擎"""
    audit_results = []
    for idx, row in order_df.iterrows():
        # 初始化审核状态
        audit_status = "pending"  # pending-待审核，approved-自动通过，rejected-拒绝，review-人工复核
        audit_reason = ""
        
        # 规则1：库存检查
        if row['stock'] <= rules['stock_threshold']:
            audit_status = "rejected"
            audit_reason = "库存不足"
        # 规则2：用户信用检查
        elif row['user_credit'] < rules['credit_threshold']:
            audit_status = "rejected"
            audit_reason = "用户信用分低于阈值"
        # 规则3：高金额订单检查
        elif row['amount'] >= rules['amount_threshold_high']:
            audit_status = "review"
            audit_reason = "订单金额过高，需人工复核"
        # 规则4：自动通过
        else:
            audit_status = "approved"
            audit_reason = "符合所有自动审核规则"
        
        # 记录审核结果
        audit_results.append({
            "order_id": row['order_id'],
            "audit_status": audit_status,
            "audit_reason": audit_reason,
            "audit_time": time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()),
            "rpa_version": "v1.0"
        })
        
        # 模拟RPA流程延迟（模拟真实系统交互）
        time.sleep(0.1)
    
    return pd.DataFrame(audit_results)

# 3. 审核结果输出与管理报表
def generate_audit_report(audit_df, order_df):
    """生成数字化管理审核报表"""
    # 合并订单数据与审核结果
    merged_df = pd.merge(order_df, audit_df, on='order_id')
    
    # 统计审核结果
    audit_summary = merged_df['audit_status'].value_counts()
    approved_rate = (audit_summary.get('approved', 0) / len(merged_df)) * 100
    rejected_rate = (audit_summary.get('rejected', 0) / len(merged_df)) * 100
    review_rate = (audit_summary.get('review', 0) / len(merged_df)) * 100
    
    # 生成管理报表
    report = {
        "audit_total": len(merged_df),
        "audit_summary": audit_summary.to_dict(),
        "approved_rate": f"{approved_rate:.2f}%",
        "rejected_rate": f"{rejected_rate:.2f}%",
        "review_rate": f"{review_rate:.2f}%",
        "rejected_detail": merged_df[merged_df['audit_status']=='rejected'][['order_id', 'audit_reason']].to_dict('records'),
        "review_detail": merged_df[merged_df['audit_status']=='review'][['order_id', 'amount']].to_dict('records')
    }
    return report

# 主程序
if __name__ == "__main__":
    print("=== 订单审核RPA流程启动 ===")
    # 加载数据与规则
    order_df, rules = load_order_data_and_rules()
    print("原始订单数据：")
    print(order_df)
    
    # 执行RPA审核
    print("\n执行自动化审核...")
    audit_df = rpa_order_audit(order_df, rules)
    print("审核结果：")
    print(audit_df)
    
    # 生成管理报表
    print("\n=== 数字化管理审核报表 ===")
    audit_report = generate_audit_report(audit_df, order_df)
    print(json.dumps(audit_report, ensure_ascii=False, indent=2))
    
    # RPA效率评估
    manual_audit_time_per_order = 1  # 人工审核单订单耗时（分钟）
    rpa_audit_time_per_order = 0.1  # RPA审核单订单耗时（分钟）
    total_manual_time = len(order_df) * manual_audit_time_per_order
    total_rpa_time = len(order_df) * rpa_audit_time_per_order
    time_saving = ((total_manual_time - total_rpa_time) / total_manual_time) * 100
    print(f"\nRPA效率评估：")
    print(f"人工审核总耗时：{total_manual_time:.1f} 分钟")
    print(f"RPA审核总耗时：{total_rpa_time:.1f} 分钟")
    print(f"时间节省率：{time_saving:.2f}%")

4.3 代码说明

规则引擎：基于用户信用、库存、订单金额三大核心规则，实现订单自动审核，覆盖 "通过 / 拒绝 / 人工复核" 三类结果；
RPA 流程：模拟真实自动化流程（含延迟），输出标准化审核结果；
管理报表：生成审核汇总、通过率、拒绝原因等核心管理指标，量化 RPA 效率（时间节省率），体现数字化管理的价值。

五、国际交流与合作机会

作为国际学术会议，将吸引全球范围内的专家学者参与。无论是发表研究成果、聆听特邀报告，还是在圆桌论坛中与行业大咖交流，都能拓宽国际视野，甚至找到潜在的合作伙伴。对于高校师生来说，这也是展示研究、积累学术人脉的好机会。