2023年第四届MathorCup高校数学建模挑战赛——大数据竞赛B题 实现代码

根据之前发布的思路 第一步 进行数据合并

python 复制代码
import pandas as pd

# 读取所有附件的数据
data1 = pd.read_excel('附件一.xlsx')
data2 = pd.read_excel('附件二.xlsx')
data3 = pd.read_excel('附件三.xlsx')
data4 = pd.read_excel('附件四.xlsx')

# 根据商品编码将附件一和附件二连接
combinedData = pd.merge(data1, data2, on='商品编码', how='inner')

# 根据商家编码将上述的结果和附件三连接
combinedData = pd.merge(combinedData, data3, on='商家编码', how='inner')

# 根据仓库编码将上述的结果和附件四连接
combinedData = pd.merge(combinedData, data4, on='仓库编码', how='inner')

# 保存合并后的数据到新的Excel文件中
combinedData.to_excel('合并后的数据.xlsx', index=False, engine='openpyxl')

或者 matlab

Matlab 复制代码
% 读取所有附件的数据
data1 = readtable('附件一.xlsx');
data2 = readtable('附件二.xlsx');
data3 = readtable('附件三.xlsx');
data4 = readtable('附件四.xlsx');

% 根据商品编码将附件一和附件二连接
combinedData = innerjoin(data1, data2, 'Keys', '商品编码');

% 根据商家编码将上述的结果和附件三连接
combinedData = innerjoin(combinedData, data3, 'Keys', '商家编码');

% 根据仓库编码将上述的结果和附件四连接
combinedData = innerjoin(combinedData, data4, 'Keys', '仓库编码');

% 保存合并后的数据到新的Excel文件中
writetable(combinedData, '合并后的数据.xlsx');

之后就是对于数据的 转码 将文本数据转化为数字

py代码

python 复制代码
# 定义数据
data = {
    "商家编码": {"1": "seller_10", "2": "seller_11", "3": "seller_12", "4": "seller_13", ...},
    "商品编码": {"1": "product_1914", "2": "product_1915", "3": "product_1916", ...},
    "仓库编码": {"1": "wh_1", "2": "wh_10", "3": "wh_11", ...},
    "商品一级分类": {"1": "手机通讯", "2": "食品饮料", "3": "家庭清洁/纸品", ...},
    "商品二级分类": {"1": "手机配件", "2": "粮油调味", "3": "进口食品", ...},
    "商品三级分类": {"1": "手机配件_5", "2": "粮油调味_1", "3": "进口食品_1", ...},
    "商家分类": {"1": "手机通讯", "2": "食品饮料", "3": "美妆护肤", ...},
    "库存分类": {"1": "A", "2": "B", "3": "D", ...},
    "商家规模": {"1": "Large", "2": "Special", "3": "Small", ...},
    "仓库类别": {"1": "Large", "2": "Special", "3": "Small", ...}
}

def transcode(record):
    for key, value in record.items():
        if value in data[key]:
            record[key] = data[key][value]
    return record

# 示例
record = {
    "商家编码": "1",
    "商品编码": "2",
    "仓库编码": "3",
    ...
}

transcoded_record = transcode(record)
print(transcoded_record)

matalb

python 复制代码
% 假设原始数据存储在一个cell array中,名为data
% data = {...};  % 你需要将这里填充为你的数据

% 定义一个map来存储转码信息
map = containers.Map();

% 定义你的转码数据
sellers = {'seller_10', 'seller_11', 'seller_12', 'seller_13', ...};
products = {'product_1914', 'product_1915', 'product_1916', 'product_1917', ...};
warehouses = {'wh_1', 'wh_10', 'wh_11', 'wh_12', ...};
% ... 添加其他数据

% 填充map
for i = 1:length(sellers)
    map(sellers{i}) = i;
end

for i = 1:length(products)
    map(products{i}) = i;
end

for i = 1:length(warehouses)
    map(warehouses{i}) = i;
end
% ... 同样地,为其他数据填充map

% 对原始数据进行转码
rows, cols = size(data);
for r = 1:rows
    for c = 1:cols
        if isKey(map, data{r, c})
            data{r, c} = map(data{r, c});
        end
    end
end

% 输出转码后的数据
disp(data);

然后 就可以进行后续分析了

相关推荐
闹小艾6 小时前
舞蹈教培机构小程序零基础制作开发全流程教程
大数据·小程序
阿乔外贸日记6 小时前
2026尼日利亚五项清关政策更新,拉高能源装备进口综合成本
大数据·人工智能·搜索引擎·智能手机·云计算·能源
暴躁小师兄数据学院6 小时前
【AI大数据工程师特训笔记】第12讲:表分区与索引
大数据·笔记·sql·postgresql
侃谈科技圈7 小时前
破除数据中台落地困境:2026数据治理平台差异化能力与选型决策指南
大数据·人工智能
Elastic 中国社区官方博客7 小时前
Elasticsearch DiskBBQ:使用原生 SIMD Blocks 实现快 40% 的向量评分计算
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·diskbbq
暴躁小师兄数据学院8 小时前
【AI大数据工程师特训笔记】第16讲:大数据环境安装
大数据·hadoop·笔记·flink·spark·database
豆豆8 小时前
垂直行业门户网站搭建解决方案与落地实操指南
大数据·cms·pageadmin·自定义模型·垂直门户·行业建站·站群建设
Elastic 中国社区官方博客9 小时前
Kibana:使用 AI Chat 及 MCP 轻松创建 AI 原生仪表板
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·信息可视化
Thomas_YXQ9 小时前
Unity无GC读取图片与网格完整方案
大数据·人工智能·unity·微信·产品运营
1892280486110 小时前
NV023固态MT29F16T08GWLCEJ9-QBES:C
大数据·服务器·人工智能·科技·缓存