2026年美赛C题思路分享及数学推导

一、题目解析

评分标准分为三个阶段:

阶段一(1~2赛季):排名法

评委的排名 + 粉丝的排名 = 选手最终的 排名,而选手最终的排名越高,意味着表现越差,越应该被淘汰;

阶段二(3~27赛季):百分比法

评委评分的百分比 + 粉丝评分的百分比 = 选手最终得分百分比 ,选手得分百分比越低,说明选手表现越差,越应该被淘汰;

阶段三(28~34赛季):回归排名法+评委裁决制度

先按照阶段一的方法确定出排名最低的两位选手,然后评委裁决谁被淘汰。

二、第一问思路总结以及公式推导

往常的预测类问题都是已知一堆的,然后根据去预测未知的。但是,这道题是我们已知评委打分和淘汰结果,需要去估计粉丝的票数。相当于是已知一部分的和所有的,让我们预测另一部分,而这种问题在数学上是"约束逆问题"。

"约束逆问题"的解的特征是:具有非唯一性,存在多组粉丝票数均满足约束

那么,我们可以利用淘汰约束缩小可行解的空间,同时引入正则化约束,最终通过Bayes方法量化确定性。(由于从一个点解预测为一个区域解,是唯一解,而Bayes方法能够量化区域解(最小的可行解空间))

将逆问题视为优化问题,求解可行解空间。

1.百分比法------对应的数据是连续数据

设定选手i的裁判得分百分比为,观众得分百分比为,合并得分百分比为,那么,我们可以得到

其中,

那么,

可以看出,合并得分百分比是一个零和博弈的结构(可以理解为1号选手得分比例上升了,那么其他所有选手的得分百分比就下降了)

(1)我们构造一下约束条件:

1)淘汰约束:本周分数最低的选手淘汰出局

,即

2)所有选手投票比例和为1:
3)非负性:
4)正则化边界:

,取

根据正则化以及上述条件可知,V的可行域为 (n - 1)维的多面体

接下来,我们来构造目标函数:

(2)构造目标函数,主要依据启发性原则。

1)温和性原则:粉丝投票不能过于极端,要相对均匀,采用最大熵的原理,也就是说选择不确定性最大、最平坦的分布。

为了量化,可以找一个比较均匀的分布作为惩罚项。

2)相关性原理:认为粉丝投票与评委投票正相关,利用此原则作为软引导,优化目标函数
3)多样性原则:允许粉丝的偏好与评委不同,引入差异化项

最终,我们设计出的目标函数为:

其中,越大,解就越趋向于粉丝票数与评委成正相关;越大,就越趋向于差异化。

根据可以看出,最终的问题是一个凸二次优化问题。

2.排名法------对应的数据是离散数据

设定第i名选手的最终排名为,评委打分排名为,观众打分排名为,那么有

同理,我们定义淘汰约束:

由于排名是离散的,其可行解是一个排序,而且粉丝排名数可能是

以后显然使用穷举法不再合适。那么,我们采用如下策略:

1)当n < 8时,采用穷举法

2)当n 8时,采用蒙特卡洛模拟求解

3.最终,结合两种方法,使用Bayes模型进行量化不确定性

(1)问题形式化

我们有一个参数向量,代表个选手的"真实实力"或"内在质量"。观测数据包括:

  • 粉丝投票结果

  • 专家评分或其他约束条件

(2)贝叶斯框架建立

1)Likelihood

假设观测数据 在给定参数 下的分布为:

其中 是预测函数。在你提出的模型中,如果我们认为目标函数 反映数据拟合程度,可以将其负指数作为似然:

这里 控制数据拟合的精度。

2)后验分布

根据贝叶斯定理:

将似然和先验代入:

其中 控制先验强度。

(3)具体模型推导

1)完整目标函数形式

我们可以将其重新组织为:

其中:

  • ) 是方差项的矩阵形式)

  • 为常数项

2)先验分布选择
  1. 非负约束⇒ 使用截断正态或 Gamma 先验

  2. 正则化边界 ⇒ 使用 Dirichlet 先验的变形

  3. 独立性假设相互独立 ⇒ 先验可分解

使用:

其中 是指示函数。

3)后验分布计算

后验分布为:

其中:

  • 是先验参数向量)

这是一个带有线性约束的指数族分布

(4)不确定性量化方法

1)后验均值和协方差(解析近似)

如果忽略截断约束,后验近似为多元正态分布:

其中:

95%置信椭圆

对于参数,边际分布为 ,其 % 置信区间为:

其中对应 95% 置信水平。

2)考虑约束的采样方法(MCMC)

当约束重要时,使用马尔可夫链蒙特卡洛

a) Metropolis-Hastings 算法
  1. 初始化

  2. 对于

    • 从提议分布 抽取候选点

    • 计算接受概率:

以概率 接受 ,否则

b)Gibbs 采样(如果条件分布可求)

对于每个 ,从其全条件分布采样:

(5)不确定性度量

1)后验汇总统计量

从后验样本 计算:

  1. 点估计

    • 后验均值:

    • 后验中位数:各分量中位数

    • MAP估计:

  2. 不确定性度量

    • 标准差:

    • 95%可信区间:(后验分位数)

    • 后验相关系数矩阵:

2)排名不确定性

由于应用涉及排名,可以计算:

  1. 排名概率矩阵

    表示选手强于选手 的后验概率。

  2. 预期排名分布

    对于每个选手 ,计算其排名在所有样本中的分布。

  3. 排名熵

    其中 是选手 排名为的概率。

相关推荐
Dev7z1 小时前
原创论文:基于LSTM的共享单车需求预测研究
人工智能·rnn·lstm
nita张2 小时前
2026年2月战略定位公司案例分享
大数据·人工智能·python
prince_zxill2 小时前
New API 详解:新一代开源大模型统一网关与 AI 资产管理系统(深度 6000 字指南)
人工智能·开源
开发者导航2 小时前
精选高质量网址资源的高效聚合综合性的网址导航:跳跳兔导航网
服务器·人工智能·程序人生·搜索引擎·开源软件
狮子座明仔2 小时前
给大模型装一台“事实核查显微镜“:RLFKV 如何用细粒度知识验证治愈金融 RAG 幻觉
人工智能·语言模型·自然语言处理·金融
民乐团扒谱机4 小时前
【深度横评】AI记忆功能全平台拆解:ChatGPT/Claude/Gemini/国产大模型谁真懂你?附隐私避坑指南
人工智能·chatgpt
gorgeous(๑>؂<๑)10 小时前
【ICLR26-金玥明-新国立】MedAgent-Pro:通过推理智能体工作流实现基于证据的多模态医疗诊断
人工智能
hqyjzsb11 小时前
企业AI人才库的搭建体系与长效运营管理方案
人工智能·学习·职场和发展·创业创新·学习方法·业界资讯·改行学it