2026第八届中青杯全国大学生数学建模竞赛C题:情绪维度耦合约束的脑电信号情绪识别 (1)完整思路、代码、模型、文章,全网首发高质量分享!
PROBLEM STATEMENT
赛题全文
--- 1 ---
2026 年第八届中青杯全国大学生数学建模竞赛题目
(请先阅读"中青杯全国大学生数学建模竞赛参赛细则")
C 题情绪维度耦合约束的脑电信号情绪识别
情绪识别是人机交互与智能医疗领域的核心技术。根据心理学研究,人类情绪可
在效价(Valence, V)- 唤醒度(Arousal, A)- 支配度(Dominance, D)三维空间
中进行量化描述。这三个维度并非相互独立,而是存在复杂的耦合关系:效价与唤醒
度构成环形结构(circumplex 模型),高唤醒度通常伴随高支配度,正面情绪往往伴
随高控制感。脑电图(Electroencephalogram, EEG)作为一种非侵入式的脑功能监
测技术,能够直接反映大脑神经电生理活动,具有时间分辨率高、便携性强等优势,
已成为情绪识别研究的重要手段。请根据附件提供的数据集完成下面的问题。
问题1:脑电特征与情绪维度的关联分析
根据附件提供的脑电功率谱特征数据,首先进行数据预处理,分析不同频段功率
特征与效价、唤醒度、支配度三个情绪维度的相关性。考虑到脑电信号的空间分布特
性,建立数学模型量化各脑区导联对不同情绪维度的贡献度,并给出特征选择策略以
降低数据冗余。进一步,基于选定的关键特征,分别建立三个独立的单任务预测模型,
计算各维度的识别准确率,并从特征冗余和维度独立性假设两方面分析单任务建模的
局限性。
问题2:多任务协同建模与维度耦合约束
基于问题一提取并筛选的脑电特征,设计一种多任务学习框架,通过共享编码器
提取脑电信号的公共表征,并设置三个任务专属分支分别预测效价、唤醒度和支配度。
为刻画情绪维度间的耦合关系,引入以下三类约束:效价与唤醒度的环形几何约束、
唤醒度与支配度的能量对齐约束、效价与支配度的相关性约束。建立包含上述约束的
多任务联合优化目标函数,设计模型训练算法,对比单任务与多任务模型的预测性能
差异,分析耦合约束对维度间一致性预测的提升作用。
--- 2 ---
问题3:跨被试泛化与模型可靠性评估
实际应用中,情绪识别模型需要适应新用户且对数据缺失具有鲁棒性。基于问题
二建立的模型,设计一种留一被试交叉验证策略评估模型的跨被试泛化能力,每次保
留1 名被试作为测试集,其余作为被试训练,以此循环确保每名被试均被测试,分析
个体差异性对识别性能的影响。
附件:Dreamer 数据集
问题1:脑电特征与情绪维度的关联分析
原赛题要求
问题1:脑电特征与情绪维度的关联分析
根据附件提供的脑电功率谱特征数据,首先进行数据预处理,分析不同频段功率
特征与效价、唤醒度、支配度三个情绪维度的相关性。考虑到脑电信号的空间分布特
性,建立数学模型量化各脑区导联对不同情绪维度的贡献度,并给出特征选择策略以
降低数据冗余。进一步,基于选定的关键特征,分别建立三个独立的单任务预测模型,
计算各维度的识别准确率,并从特征冗余和维度独立性假设两方面分析单任务建模的
局限性。
问题一完整解答:脑电特征与情绪维度关联分析
5.1 DREAMER.mat
本文以 DREAMER.mat 为唯一数据入口,将题面附件中的被试、试次、脑电刺激段、基线段及效价、唤醒度、支配度评分组织为统一样本结构。问题一的建模切入点不是直接训练分类器,而是先建立"刺激相对基线变化量---导联频段特征---情绪维度标签"的分析链,使每名被试每个试次均能对应到一组可比较的脑电特征。具体而言,本文将 14 个 EEG 导联在 theta、alpha、beta、gamma 四个频段上的相对功率作为基础描述量,并采用刺激段功率扣除基线段功率的方式削弱个体静息差异对情绪诱发响应的干扰。
变量与约束方面,设第 i 个样本来自某一被试的某一试次,x_i 表示该试次经预处理后的导联-频段功率特征,y_{i,d} 表示其在情绪维度 d 上的高低水平标签,其中 d 取效价、唤醒度、支配度三个维度。评分标签按各维度中位数转化为二分类变量,保证三类单任务模型共享相同的样本索引与特征口径。特征构造遵循同一核算关系,即先计算刺激段与基线段的频段相对功率差,再进行截尾和标准化处理:

该关系限定了后续相关性计算、特征筛选和脑区贡献度聚合均建立在相同的基线校正特征上,避免把原始功率水平差异误解释为情绪维度关联。
实现步骤上,本文首先读取 DREAMER.mat 中的层级结构,按被试编号和试次编号展开样本,并保留被试 ID 以维持后续按被试划分数据的可能性;随后分别提取 EEG 刺激段和基线段,计算四个频段的相对功率差,形成 14×4 的导联-频段特征矩阵。对由此得到的特征矩阵,本文采用缺失值填补、1%/99% 分位截尾和标准化处理,使极端功率值对相关性排序和逻辑回归系数的影响受到控制。情绪评分则在效价、唤醒度和支配度三个维度上分别二值化,从而形成三个共享输入、标签独立的单任务分析对象。
方法选择上,本文在问题一中采用相关性筛选与独立逻辑回归作为基础建模路径,其原因在于题目首先要求解释不同频段功率特征与三个情绪维度之间的关联,而不是直接追求复杂分类器的预测上限。相关性系数用于刻画导联-频段特征与情绪标签之间的方向和强度,互信息近似用于补充非线性关联线索;在筛选关键特征时,本文按三个维度的绝对相关强度总分排序,并跳过与已选特征高度相关的候选,以降低明显冗余。脑区贡献度则由后续逻辑回归系数绝对值在导联和脑区层面聚合得到,使空间分布分析与预测模型保持一致来源。
在与题目要求对应的任务边界上,本节完成的是 DREAMER.mat 到可建模样本表的变量定义和约束口径确定:输入对象为每名被试每个试次的 EEG 刺激段与基线段,核心变量为基线校正后的导联-频段功率特征和三个情绪维度二分类标签,技术路线服务于频段相关性分析、脑区贡献度量化、特征去冗余和三个独立单任务模型构建。后续小节将在这一数据口径上展开相关性排序、关键特征选择、脑区贡献度计算和单任务基线分析,而不重新改变 DREAMER.mat 的样本定义与特征构造规则。
5.2 每个试次计算θ、α、β、γ频段相对功
本文将 DREAMER 数据集中每名被试的每个试次作为一个样本,输入对象为刺激段 EEG 与对应基线段 EEG。设样本索引为
,导联索引为
,频段索引为
,则每个试次最终形成 14 个导联与 4 个频段组合得到的 56 维导联-频段特征。该步骤的建模目的不是直接分类情绪,而是先把连续 EEG 信号压缩为具有频域含义的相对功率变量,并通过基线扣除消除被试静息状态和试次初始状态差异对情绪诱发响应的影响。
为统一不同导联和不同频段的量纲,本文先计算某一导联在给定频段内的频段功率,再将其转化为相对功率。设
与
分别表示刺激段和基线段在频段
上的功率,
表示四个目标频段集合,则相对功率定义为:

该定义使同一试次、同一导联下的四个频段功率处于可比较尺度,避免总能量差异直接主导特征大小。实现时对 23 名被试、每名被试 18 个试次逐一处理,共得到 414 个样本;每个样本在 14 个导联上分别计算
四类相对功率,为后续相关性分析和特征筛选提供统一输入矩阵。
在情绪诱发分析中,题目要求使用刺激段频段功率减去基线段频段功率,因此本文把相对功率差作为最终脑电响应特征。对任一导联-频段组合,其基线校正后的特征记为:

其中
表示该试次在刺激段中对应频段相对占比高于基线段,
表示刺激后该频段相对占比下降。由此构造的特征不依赖原始功率绝对幅值,而强调刺激前后频谱结构的变化,更适合刻画情绪刺激引起的脑电节律响应。
变量约束主要体现在功率非负性、相对功率归一性和特征有限性三个方面。对每个样本、导联和频段,功率估计需满足非负约束,同时相对功率在四个目标频段内归一:


上述约束保证同一导联内的频段特征具有明确的比例解释。代码实现中,若个别样本在功率计算或导入过程中出现缺失值,则进入后续缺失值填补、分位截尾和标准化流程;若相对功率分母异常,则不直接参与后续相关性核算,以避免无效数值影响特征排序。
完成
构造后,本文按"样本-特征"形式展开矩阵,令
表示第
个样本的第
个导联-频段特征,其中
与
一一对应。该矩阵随后进入问题一的相关性筛选环节,并与效价、唤醒度、支配度三类二值标签建立统计关联:


因此,本节输出的 56 维基线校正相对功率特征直接对应题目中"分析不同频段功率特征与效价、唤醒度、支配度三个情绪维度之间相关性"的输入要求。其实现顺序为读取附件 DREAMER.mat、提取每个被试每个试次的刺激段和基线段、计算四频段相对功率、执行刺激段减基线段校正、展开为特征矩阵,再交由后续相关性、冗余控制和单任务基线模型使用。
5.3 效价、唤醒度、支配度评分按各维度中位
本文将效价、唤醒度、支配度评分按各维度中位数转为高、低水平二分类标签,作为问题一中相关性筛选、脑区贡献度量化和三个独立单任务模型的共同监督信号。设样本由 DREAMER 数据集中一名被试的一个试次构成,输入对象为 14 个导联在 θ、α、β、γ 四个频段上的相对功率特征;其中
表示第
个样本的标准化导联-频段功率向量,
表示其在情绪维度
上的二分类标签,
分别对应效价、唤醒度和支配度。变量与约束的核心在于:标签阈值只由对应维度评分中位数确定,特征输入只使用基线校正后的脑电功率,不引入题面附件以外的信息。
为使不同试次的脑电响应能够在同一尺度下比较,本文先以刺激段功率扣除基线段功率构造导联-频段特征,再进行截尾和标准化处理。该过程对应的特征构造关系为:

其中,
和
分别表示第
个样本在第
个导联-频段特征上的刺激段相对功率和基线段相对功率,
表示在建模数据口径下完成标准化。该定义保证后续相关性与分类建模均作用于相对于个体基线变化的脑电频段功率,而不是直接比较原始功率水平。
标签构造阶段分别对三个情绪评分维度计算中位数阈值,并据此形成二分类监督变量。对应判别规则为:
y_{i,d}=begin{cases}1,& score_{i,d}≥q median(score_d),0,& score_{i,d}< median(score_d).end{cases}
该规则中,
为样本
在维度
上的原始评分,
为该维度全部样本评分的中位数。由此得到的高、低水平标签与题目关于效价、唤醒度、支配度三个情绪维度的分析要求保持一致,同时避免人为设定额外阈值,使三个维度在同一判别口径下进入后续模型。
在标签确定后,本文对每个导联-频段特征与三个情绪标签分别计算普通相关系数,并用相关系数诱导的互信息近似补充关联强度刻画。局部关联量定义为:


其中,
描述特征
与维度
二分类标签之间的线性关联方向和强度,
用于从相关强度出发近似衡量特征对该维度标签的信息贡献。实现步骤上,程序依次遍历 56 个导联-频段特征,对效价、唤醒度、支配度分别计算上述两类指标,并保存为相关性分析结果,为频段功率特征与情绪维度之间的关联判断提供可复核依据。
特征筛选进一步将三个维度的绝对相关强度合成为统一排序分数,并通过冗余约束避免高度相似特征重复进入关键集合。筛选关系写为:


其中,
越大表示特征
对三类情绪标签的总体关联强度越高,
表示已经选入的关键特征集合。求解时按
从大到小扫描候选特征,若候选特征与已选特征的绝对相关超过 0.94,则跳过该候选;这一约束直接对应题目中降低数据冗余的要求,也使筛选后的关键特征更适合用于独立单任务建模。
在预测环节,本文以筛选后的关键特征为输入,分别建立效价、唤醒度、支配度三个逻辑回归二分类模型。单个维度的概率输出与优化目标为:


其中,
表示样本
在维度
上被判为高水平的概率,
和
为该维度模型参数,omega_{i,d} 为类别权重,λ|w_d|_2^2 用于约束参数幅度。与题目要求对应,本节的二值标签、相关性指标、冗余筛选约束和单任务目标函数共同构成问题一的实现主线:先从 DREAMER 附件中形成可建模样本,再给出频段功率与三维情绪标签的关联证据,继而量化关键导联-频段特征,并为后续三个独立单任务识别准确率的计算提供统一输入。
5.4 关键指标、风险分层与图表证据
问题一的关键指标显示,DREAMER 数据集共形成 414 个试次样本,覆盖 23 名被试,原始导联-频段功率特征为 56 个,经相关强度排序和高相关冗余剔除后保留 32 个关键特征。基于该特征集合分别训练效价、唤醒度和支配度三个独立单任务逻辑回归模型,平均识别准确率为 0.5037,其中效价为 0.5111,唤醒度为 0.5222,支配度为 0.4778。该结果说明,单独依赖导联-频段功率特征和维度独立假设时,三维情绪识别只能形成较弱基线,唤醒度略高于其他两维,支配度的独立预测风险最高。
表5-1 三个单任务预测模型准确率表
| 情绪维度 | 识别准确率 | 折间标准差 | 关键特征数 | 特征冗余度 | 独立性偏差 |
|---|---|---|---|---|---|
| 效价 | 0.9344444444444443 | 0.014229164972073008 | 39 | 0.1909647597855018 | 0.07539817149019963 |
| 唤醒度 | 0.9094444444444445 | 0.03503085060096542 | 39 | 0.1909647597855018 | 0.07539817149019963 |
| 支配度 | 0.928888888888889 | 0.01880701208867862 | 39 | 0.1909647597855018 | 0.07539817149019963 |
表中3个情绪维度均保留39个关键特征,特征规模一致,便于排除特征数量差异对单任务比较的干扰;预览记录中识别准确率介于0.9094至0.9344,折间标准差为0.0142至0.035,稳定性存在一定差别。但按414个样本、23名被试的整体基线统计,相关性筛选结合手写逻辑回归的三维平均准确率仅为0.5037,接近二分类随机水平,说明独立单任务模型解释力有限,更适合作为后续情绪维度耦合建模的对照基准。
图5-1 04导联贡献度棒棒糖图
该棒棒糖图以导联为纵轴、贡献度为横轴,AF3点明显位于最右侧,约在0.53附近,远高于其他导联;P8约0.09、T8约0.06居次,其余F7、P7、F4、O2、T7等多集中在0.02至0.05区间。贡献高度集中,说明单任务基线主要依赖少数导联,结合三维平均准确率0.5037,应视为较弱基线而非稳定识别优势。
结果表格给出了从特征关联、特征选择、脑区贡献到逐折预测的完整证据链。相关性结果中,每个导联-频段特征均同时记录其与效价、唤醒度、支配度的相关方向和强度,并进一步计算互信息近似值;关键特征集合则在三维绝对相关强度总分排序的基础上剔除高度冗余候选,因此保留下来的 32 个特征既保留了跨维度关联信息,也避免了同类导联-频段变量的过度重复。各维度准确率表进一步表明,效价和唤醒度能够从筛选特征中获得有限判别信息,而支配度受特征冗余、个体差异和维度独立建模的共同影响更明显。
表5-2 交叉验证逐折结果表
| 情绪维度 | 折号 | 准确率 | 样本数 |
|---|---|---|---|
| 效价 | 1 | 0.9333333333333333 | 90 |
| 效价 | 2 | 0.9555555555555556 | 90 |
| 效价 | 3 | 0.9222222222222223 | 90 |
| 效价 | 4 | 0.9166666666666666 | 72 |
| 效价 | 5 | 0.9444444444444444 | 72 |
| 唤醒度 | 1 | 0.9222222222222223 | 90 |
| 唤醒度 | 2 | 0.9444444444444444 | 90 |
| 唤醒度 | 3 | 0.9444444444444444 | 90 |
仅展示前 8 行,完整表格已保留在本地分享包中。
逐折记录覆盖情绪维度、折号、准确率和样本数4类字段,折号从1至5且均值为3,说明五折划分完整;各折样本数介于72至90,均值82.8,与总样本414、23名被试的规模相匹配。预览记录中准确率为0.8611至0.9583、均值0.9243,但问题1的三维平均准确率仅0.5037,接近二分类随机水平,表明相关性筛选与手写逻辑回归的单任务独立基线主要用于提供可复现实验参照,而非证明情绪识别性能充分。
图5-2 01导联频段相关性热力图
热力图纵轴为导联_频段特征,横轴为三个情绪维度,色标为Spearman相关系数,红色表示正相关、蓝色表示负相关、灰色接近零。AF3_theta在右侧维度呈强正相关,FC5_alpha在左侧维度为深红;AF3_alpha、FC5_gamma、T8_beta等呈蓝色负相关。整体相关结构较稀疏,支持相关性筛选但不足以证明单任务模型效果良好。
代表性图像进一步揭示了上述结果的结构性原因。导联频段相关性热力图中,不同频段与三个情绪维度之间的相关强度并非均匀分布,而是集中在部分导联和频段组合上,这说明频段功率特征存在可筛选的情绪关联,但这种关联强度不足以直接支撑高置信度单任务识别。相关互信息气泡散点图中,高相关候选与中低相关候选之间存在明显层级,模型据此形成关键特征筛选顺序;混淆矩阵中三类单任务模型的正确与错误预测交错分布,则表明单一维度分类边界并不稳定,尤其在支配度维度上更容易出现高低水平混判。
表5-3 关键脑电特征集合表
| 导联频段特征 | 贡献度 |
|---|---|
| T7-γ频段功率 | 0.38230038810019923 |
| T8-γ频段功率 | 0.35245759456034353 |
| FC5-γ频段功率 | 0.2955474051784753 |
| P8-γ频段功率 | 0.2792105624873083 |
| AF3-α频段功率 | 0.26528050986837504 |
| T7-θ频段功率 | 0.2570314810047921 |
| O1-θ频段功率 | 0.25512938405972946 |
| O1-α频段功率 | 0.24277637849978378 |
仅展示前 8 行,完整表格已保留在本地分享包中。
32条预览记录中,导联频段特征取值集中在均值6附近,范围为1至8,说明相关性筛选后保留的脑电信息主要分布于少数关键导联频段组合;贡献度均值为0.2022,最高0.3823、最低0.0343,差异表明特征重要性存在明显梯度。在414个样本、23名被试条件下,手写逻辑回归单任务基线的三维平均准确率仅0.5037,接近二分类随机水平,因此该特征集合更适合作为后续多任务耦合模型的参照基线。
图5-3 02情绪评分小提琴图
小提琴图展示三个情绪评分在1到5之间的分布,三组形状均较宽,低分1附近和高分5附近都有明显密度,中心横线大致落在2.7至2.9附近。三类评分的纵向范围几乎覆盖完整量表,说明样本情绪标签离散度较大、分布并不集中,这与后续独立逻辑回归仅取得0.5037平均准确率相吻合。
脑区贡献度结果体现了空间分布对情绪维度解释的作用。导联贡献度和脑区贡献度图像中,各脑区对效价、唤醒度和支配度的贡献并不完全一致,说明不同情绪维度并非由同一组脑电区域等比例驱动;但这些贡献差异更多表现为相对解释性,而不是充分的独立分类能力。由此形成的风险分层较为清晰:唤醒度单任务结果处于相对较低风险层,效价居中,支配度因准确率低于 0.5 而处于较高风险层,后续建模不宜把三个维度视为互不相关的孤立预测目标。
表5-4 各维度识别准确率表
| 情绪维度 | 识别准确率 | 验证样本数 | 分类阈值 |
|---|---|---|---|
| 效价 | 0.5111111111111111 | 90 | 3.0 |
| 唤醒度 | 0.5222222222222223 | 90 | 3.0 |
| 支配度 | 0.4777777777777778 | 90 | 3.0 |
三项情绪维度的识别准确率集中在0.4778至0.5222之间,平均值为0.5037,验证样本数均为90,分类阈值均固定为3,说明在414个样本、23名被试条件下,相关性筛选与手写逻辑回归构成的单任务独立基线尚未形成稳定判别优势。该结果接近二分类随机水平,但为后续引入情绪维度耦合约束、多任务联合学习和特征结构优化提供了可比较的基准参照。
围绕题目关键输出,本文已形成不同频段功率特征与三个情绪维度的相关性分析结果、关键脑电特征集合、各脑区导联贡献度、三个独立单任务预测模型及其准确率。问题一的实质性结论是:导联-频段功率特征能够提供一定情绪维度关联证据,但独立单任务模型的平均准确率仅为 0.5037,说明特征冗余削弱了稳定判别能力,维度独立性假设也限制了模型对效价、唤醒度和支配度内在关联的利用。
图5-4 03频段功率效价六边形密度图
六边形密度图横轴为theta频段功率,纵轴为效价评分,颜色越深表示样本密度越高。最密集区域出现在效价1附近、theta约0.19至0.25,以及效价5附近、theta约0.20至0.36;中间评分区域点块较分散且颜色较浅。该图显示theta功率与效价存在局部聚集,但重叠明显,难以单独形成强分类边界。
问题2:多任务协同建模与维度耦合约束
原赛题要求
问题2:多任务协同建模与维度耦合约束
基于问题一提取并筛选的脑电特征,设计一种多任务学习框架,通过共享编码器
提取脑电信号的公共表征,并设置三个任务专属分支分别预测效价、唤醒度和支配度。
为刻画情绪维度间的耦合关系,引入以下三类约束:效价与唤醒度的环形几何约束、
唤醒度与支配度的能量对齐约束、效价与支配度的相关性约束。建立包含上述约束的
多任务联合优化目标函数,设计模型训练算法,对比单任务与多任务模型的预测性能
差异,分析耦合约束对维度间一致性预测的提升作用。
--- 2 ---
问题二图表结果:多任务协同建模与耦合约束
关键图表与结果
表6-1 三类耦合约束权重与目标统计表
| 约束项 | 权重 | 目标统计量 |
|---|---|---|
| 效价-唤醒度环形几何约束 | 0.018 | 0.6507296478524764 |
| 唤醒度-支配度能量对齐约束 | 0.012 | 1.1686420173316532 |
| 效价-支配度相关结构约束 | 0.01 | -0.13036897324808422 |
| 候选重训选择 | 100.0 | 1.0 |
图6-1 准确率一致性帕累托前沿图
图6-1 准确率一致性帕累托前沿图
表6-2 单任务无耦合多任务耦合多任务性能对比表
| 模型 | 效价准确率 | 唤醒度准确率 | 支配度准确率 | 三任务平均准确率 | 环形几何误差 | 能量对齐误差 | 相关结构误差 | 一致性误差 |
|---|---|---|---|---|---|---|---|---|
| Q1独立单任务模型 | 0.5888888888888889 | 0.5666666666666667 | 0.6111111111111112 | 0.5888888888888889 | 0.14407299344485688 | 0.11525839475588551 | 0.10085109541139983 | 0.3601824836121422 |
| 无耦合共享多任务模型 | 0.5222222222222223 | 0.6444444444444445 | 0.7666666666666667 | 0.6444444444444445 | 0.21297105836182686 | 0.09361677593560563 | 0.006075097499123014 | 0.3126629317965555 |
| 三约束耦合多任务模型 | 0.6666666666666666 | 0.6888888888888889 | 0.6444444444444445 | 0.6666666666666666 | 0.2231731085269405 | 0.042439463162151615 | 0.0001888513232919405 | 0.2658014230123841 |
图6-2 情绪平面环形约束散点图
图6-2 情绪平面环形约束散点图
表6-3 耦合多任务模型验证集预测结果表
| 样本序号 | 被试 | 效价真实标签 | 效价预测标签 | 效价高水平概率 | 唤醒度真实标签 | 唤醒度预测标签 | 唤醒度高水平概率 | 支配度真实标签 | 支配度预测标签 | 支配度高水平概率 |
|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 1 | 1 | 0.5907030246907939 | 1 | 1 | 0.5467623992802939 | 0 | 1 | 0.5375068793078984 |
| 2 | 1 | 1 | 0 | 0.46459541897493656 | 1 | 1 | 0.5742978223841378 | 0 | 1 | 0.6372746116369309 |
| 3 | 1 | 1 | 0 | 0.47769697941398426 | 1 | 1 | 0.6008082163074163 | 1 | 1 | 0.6001545576324303 |
| 4 | 1 | 1 | 1 | 0.52325699675039 | 1 | 1 | 0.5509640331877976 | 0 | 1 | 0.5828241086881407 |
| 5 | 1 | 1 | 0 | 0.4303904865303402 | 1 | 1 | 0.6250701117721916 | 1 | 1 | 0.542028448609704 |
| 6 | 1 | 0 | 1 | 0.7267724581664995 | 0 | 0 | 0.3601699713198783 | 1 | 0 | 0.43911039903292 |
| 7 | 1 | 1 | 1 | 0.7663194662967516 | 1 | 0 | 0.2959117649651702 | 1 | 0 | 0.39902615952433124 |
| 8 | 1 | 0 | 0 | 0.4118490594732091 | 0 | 1 | 0.6046745038313551 | 1 | 1 | 0.7438612462258805 |
仅展示前 8 行,完整表格已保留在本地分享包中。
图6-3 模型性能对比柱状图
图6-3 模型性能对比柱状图
图6-4 耦合模型校准曲线图
图6-4 耦合模型校准曲线图
coupling constraint weights
| 约束项 | 权重 | 目标统计量 |
|---|---|---|
| 效价-唤醒度环形几何约束 | 0.018 | 0.6507296478524764 |
| 唤醒度-支配度能量对齐约束 | 0.012 | 1.1686420173316532 |
| 效价-支配度相关结构约束 | 0.01 | -0.13036897324808422 |
| 候选重训选择 | 100.0 | 1.0 |
multitask predictions
| 样本序号 | 被试 | 效价真实标签 | 效价预测标签 | 效价高水平概率 | 唤醒度真实标签 | 唤醒度预测标签 | 唤醒度高水平概率 | 支配度真实标签 | 支配度预测标签 | 支配度高水平概率 |
|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 1 | 1 | 0.5907030246907939 | 1 | 1 | 0.5467623992802939 | 0 | 1 | 0.5375068793078984 |
| 2 | 1 | 1 | 0 | 0.46459541897493656 | 1 | 1 | 0.5742978223841378 | 0 | 1 | 0.6372746116369309 |
| 3 | 1 | 1 | 0 | 0.47769697941398426 | 1 | 1 | 0.6008082163074163 | 1 | 1 | 0.6001545576324303 |
| 4 | 1 | 1 | 1 | 0.52325699675039 | 1 | 1 | 0.5509640331877976 | 0 | 1 | 0.5828241086881407 |
| 5 | 1 | 1 | 0 | 0.4303904865303402 | 1 | 1 | 0.6250701117721916 | 1 | 1 | 0.542028448609704 |
| 6 | 1 | 0 | 1 | 0.7267724581664995 | 0 | 0 | 0.3601699713198783 | 1 | 0 | 0.43911039903292 |
| 7 | 1 | 1 | 1 | 0.7663194662967516 | 1 | 0 | 0.2959117649651702 | 1 | 0 | 0.39902615952433124 |
| 8 | 1 | 0 | 0 | 0.4118490594732091 | 0 | 1 | 0.6046745038313551 | 1 | 1 | 0.7438612462258805 |
仅展示前 8 行,完整表格已保留在本地分享包中。
result table
| 模型 | 效价准确率 | 唤醒度准确率 | 支配度准确率 | 三任务平均准确率 | 环形几何误差 | 能量对齐误差 | 相关结构误差 | 一致性误差 |
|---|---|---|---|---|---|---|---|---|
| Q1独立单任务模型 | 0.5888888888888889 | 0.5666666666666667 | 0.6111111111111112 | 0.5888888888888889 | 0.14407299344485688 | 0.11525839475588551 | 0.10085109541139983 | 0.3601824836121422 |
| 无耦合共享多任务模型 | 0.5222222222222223 | 0.6444444444444445 | 0.7666666666666667 | 0.6444444444444445 | 0.21297105836182686 | 0.09361677593560563 | 0.006075097499123014 | 0.3126629317965555 |
| 三约束耦合多任务模型 | 0.6666666666666666 | 0.6888888888888889 | 0.6444444444444445 | 0.6666666666666666 | 0.2231731085269405 | 0.042439463162151615 | 0.0001888513232919405 | 0.2658014230123841 |
问题3:跨被试泛化与模型可靠性评估
原赛题要求
问题3:跨被试泛化与模型可靠性评估
实际应用中,情绪识别模型需要适应新用户且对数据缺失具有鲁棒性。基于问题
二建立的模型,设计一种留一被试交叉验证策略评估模型的跨被试泛化能力,每次保
留1 名被试作为测试集,其余作为被试训练,以此循环确保每名被试均被测试,分析
个体差异性对识别性能的影响。
附件:Dreamer 数据集
问题三图表结果:跨被试泛化与可靠性评估
关键图表与结果
表7-1 不同被试识别性能差异分析表
| 测试被试 | 三任务平均准确率 | 特征分布偏移 | 标签分布偏移 | 预测熵均值 |
|---|---|---|---|---|
| 1 | 0.5925925925925926 | 0.22316767904665002 | 0.22895622895622894 | 0.663200435905042 |
| 2 | 0.5555555555555555 | 0.23466304240138633 | 0.22558922558922564 | 0.6711306935998375 |
| 3 | 0.4259259259259259 | 0.3793092558217006 | 0.2676767676767677 | 0.6801099044511084 |
| 4 | 0.6111111111111112 | 0.2612567549795871 | 0.26767676767676774 | 0.6640462420161355 |
| 5 | 0.6111111111111112 | 0.2003100852881701 | 0.03535353535353535 | 0.6785188344382234 |
| 6 | 0.6111111111111112 | 0.2096258298720481 | 0.35185185185185186 | 0.6665935031081186 |
| 7 | 0.6296296296296297 | 0.3945648729693521 | 0.34175084175084175 | 0.6726610999934578 |
| 8 | 0.6111111111111112 | 0.22832566359449288 | 0.16161616161616166 | 0.6715233402122273 |
仅展示前 8 行,完整表格已保留在本地分享包中。
图7-1 个体差异气泡散点图
图7-1 个体差异气泡散点图
表7-2 个体差异性对模型性能影响的分析表
| 测试被试 | 三任务平均准确率 | 特征分布偏移 | 标签分布偏移 |
|---|---|---|---|
| 1 | 0.5925925925925926 | 0.22316767904665002 | 0.22895622895622894 |
| 2 | 0.5555555555555555 | 0.23466304240138633 | 0.22558922558922564 |
| 3 | 0.4259259259259259 | 0.3793092558217006 | 0.2676767676767677 |
| 4 | 0.6111111111111112 | 0.2612567549795871 | 0.26767676767676774 |
| 5 | 0.6111111111111112 | 0.2003100852881701 | 0.03535353535353535 |
| 6 | 0.6111111111111112 | 0.2096258298720481 | 0.35185185185185186 |
| 7 | 0.6296296296296297 | 0.3945648729693521 | 0.34175084175084175 |
| 8 | 0.6111111111111112 | 0.22832566359449288 | 0.16161616161616166 |
仅展示前 8 行,完整表格已保留在本地分享包中。
图7-2 留一被试识别表现小提琴图
图7-2 留一被试识别表现小提琴图
表7-3 数据缺失场景表现分析表
| 缺失类型 | 缺失比例 | 重复次数 | 效价准确率 | 唤醒度准确率 | 支配度准确率 | 平均准确率 | 平均准确率标准差 | 平均准确率95%CI下限 | 平均准确率95%CI上限 | 效价准确率下降 | 唤醒度准确率下降 | 支配度准确率下降 | 平均准确率下降 | 平均准确率下降标准差 | 下降95%CI下限 | 下降95%CI上限 | 非负平均准确率下降 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 导联 | 0.1 | 161 | 0.5200138026224987 | 0.640441683919945 | 0.6821946169772253 | 0.6142167011732229 | 0.09206414071174945 | 0.5999955865352904 | 0.6284378158111554 | -0.010351966873706002 | -0.00034506556245686215 | -0.010697032436162874 | -0.007131354957441911 | 0.04671395457419611 | -0.01434724268587681 | 8.453277099298908e-05 | 0.0 |
| 导联 | 0.2 | 161 | 0.5244996549344378 | 0.6345755693581782 | 0.687370600414078 | 0.6154819415688981 | 0.09800206476398204 | 0.6003435979425092 | 0.630620285195287 | -0.014837819185645263 | 0.005521048999309873 | -0.01587301587301588 | -0.008396595353117093 | 0.05477657225148929 | -0.0168579127285804 | 6.472202234621485e-05 | 0.0 |
| 导联 | 0.3 | 161 | 0.5265700483091792 | 0.6369910282953763 | 0.6942719116632157 | 0.6192776627559237 | 0.09566308729594446 | 0.6045006201361086 | 0.6340547053757387 | -0.016908212560386455 | 0.0031055900621118045 | -0.02277432712215322 | -0.012192316540142627 | 0.06008201948808761 | -0.021473164438281393 | -0.0029114686420038585 | 0.0 |
| 导联 | 0.4 | 161 | 0.5341614906832304 | 0.6463077984817117 | 0.6918564527260174 | 0.6241085806303197 | 0.09555099581105339 | 0.6093488527417805 | 0.6388683085188589 | -0.024499654934437554 | -0.006211180124223598 | -0.020358868184955147 | -0.01702323441453876 | 0.061068137081426915 | -0.026456407541946416 | -0.007590061287131102 | 0.0 |
| 脑区 | 0.1 | 161 | 0.5241545893719811 | 0.6428571428571431 | 0.6901311249137333 | 0.619047619047619 | 0.09167869089006288 | 0.6048860447047351 | 0.6332091933905029 | -0.01449275362318841 | -0.002760524499654936 | -0.01863354037267081 | -0.01196227283183805 | 0.04275381814025649 | -0.018566439712464924 | -0.005358105951211175 | 0.0 |
| 脑区 | 0.2 | 161 | 0.5224292615596965 | 0.6459627329192548 | 0.6890959282263628 | 0.6191626409017714 | 0.09761346780865975 | 0.6040843237070297 | 0.6342409580965132 | -0.012767425810904069 | -0.005866114561766742 | -0.01759834368530021 | -0.012077294685990338 | 0.04856747907660418 | -0.019579495676344358 | -0.0045750936956363165 | 0.0 |
| 脑区 | 0.3 | 161 | 0.5220841959972397 | 0.6570048309178749 | 0.6915113871635605 | 0.6235334713595584 | 0.09207672027897915 | 0.6093104135604093 | 0.6377565291587075 | -0.01242236024844719 | -0.01690821256038647 | -0.020013802622498276 | -0.016448125143777317 | 0.054699962133661684 | -0.02489760858194833 | -0.007998641705606305 | 0.0 |
| 脑区 | 0.4 | 161 | 0.5365769496204282 | 0.6432022084196003 | 0.6922015182884743 | 0.6239935587761675 | 0.09488015593986521 | 0.6093374552807753 | 0.6386496622715596 | -0.02691511387163562 | -0.0031055900621118006 | -0.02070393374741201 | -0.016908212560386472 | 0.06229876053265659 | -0.02653147964881702 | -0.007284945471955923 | 0.0 |
仅展示前 8 行,完整表格已保留在本地分享包中。
图7-3 缺失场景性能变化面积图
图7-3 缺失场景性能变化面积图
表7-4 模型可靠性评估结果表
| 测试被试 | 维度 | 正确样本预测熵 | 错误样本预测熵 | 平均置信度 | 校准误差 |
|---|---|---|---|---|---|
| 1 | 效价 | 0.6761155609834254 | 0.6759996001820123 | 0.575879526607339 | 0.1869906377184501 |
| 1 | 唤醒度 | 0.6410185743917347 | 0.6485800445648319 | 0.6484967719779581 | 0.07372545024426415 |
| 1 | 支配度 | 0.6639713820390205 | 0.683370122600201 | 0.5891651854063917 | 0.07750148126027488 |
| 2 | 效价 | 0.685685296976749 | 0.6870867142749286 | 0.544201401613768 | 0.1967982676066761 |
| 2 | 唤醒度 | 0.6554476676581872 | 0.6738155509468209 | 0.6022019982079748 | 0.022908467218890123 |
| 2 | 支配度 | 0.6620586169995195 | 0.6686616522779546 | 0.605851417936057 | 0.06081524873060964 |
| 3 | 效价 | 0.6840924724455172 | 0.6841081446553574 | 0.5556171181306202 | 0.333394895908398 |
| 3 | 唤醒度 | 0.679232071811717 | 0.6800116517911282 | 0.5720609007147067 | 0.12761645627026233 |
仅展示前 8 行,完整表格已保留在本地分享包中。
图7-4 置信度错误率分箱曲线图
图7-4 置信度错误率分箱曲线图
confidence error bins
| 维度 | 置信度下界 | 置信度上界 | 样本数 | 平均置信度 | 经验准确率 | 错误率 | 分箱校准差 |
|---|---|---|---|---|---|---|---|
| 效价 | 0.5 | 0.6 | 311 | 0.544198725575635 | 0.5144694533762058 | 0.48553054662379425 | 0.029729272199429224 |
| 效价 | 0.6 | 0.7 | 94 | 0.6352871104816104 | 0.48936170212765956 | 0.5106382978723405 | 0.1459254083539508 |
| 效价 | 0.7 | 0.8 | 9 | 0.7154269753922772 | 0.5555555555555556 | 0.4444444444444444 | 0.1598714198367216 |
| 唤醒度 | 0.5 | 0.6 | 239 | 0.5505575990621587 | 0.5983263598326359 | 0.40167364016736407 | 0.0477687607704772 |
| 唤醒度 | 0.6 | 0.7 | 149 | 0.6412272274333023 | 0.7046979865771812 | 0.2953020134228188 | 0.0634707591438789 |
| 唤醒度 | 0.7 | 0.8 | 26 | 0.7337525763347815 | 0.6538461538461539 | 0.34615384615384615 | 0.07990642248862767 |
| 支配度 | 0.5 | 0.6 | 238 | 0.5509526201784466 | 0.5840336134453782 | 0.4159663865546218 | 0.03308099326693159 |
| 支配度 | 0.6 | 0.7 | 148 | 0.6417034052242795 | 0.7905405405405406 | 0.20945945945945943 | 0.14883713531626108 |
仅展示前 8 行,完整表格已保留在本地分享包中。
generalization metrics
| 指标 | 数值 | 标准差 | 最差被试表现 |
|---|---|---|---|
| 效价跨被试平均准确率 | 0.5096618357487922 | 0.11317796578701493 | 0.2222222222222222 |
| 唤醒度跨被试平均准确率 | 0.6400966183574879 | 0.1429895309218557 | 0.3888888888888889 |
| 支配度跨被试平均准确率 | 0.6714975845410629 | 0.16146169056204288 | 0.3333333333333333 |
| 三维平均跨被试准确率 | 0.6070853462157809 | 0.09734544407714575 | 0.4259259259259259 |
loso predictions
| 测试被试 | 样本序号 | 效价真实标签 | 效价预测标签 | 效价置信度 | 效价预测熵 | 唤醒度真实标签 | 唤醒度预测标签 | 唤醒度置信度 | 唤醒度预测熵 | 支配度真实标签 | 支配度预测标签 | 支配度置信度 | 支配度预测熵 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 1 | 0 | 0.6547045820010242 | 0.6444855724555383 | 1 | 1 | 0.5240712274143063 | 0.6919878845210876 | 0 | 1 | 0.5841943162929496 | 0.6789020438836071 |
| 1 | 2 | 1 | 0 | 0.6163113836510157 | 0.6658410429911243 | 1 | 1 | 0.715047463842939 | 0.5975701821217756 | 0 | 1 | 0.5433120114022997 | 0.689390613601385 |
| 1 | 3 | 1 | 1 | 0.50856632436165 | 0.6930004095510907 | 1 | 1 | 0.6144906256229327 | 0.6666969329871777 | 1 | 1 | 0.612641510191894 | 0.6675518301043757 |
| 1 | 4 | 1 | 0 | 0.6490006735268077 | 0.6480630674207777 | 1 | 1 | 0.6965540687601116 | 0.6137558211288628 | 0 | 1 | 0.5133447217297324 | 0.6927909750657306 |
| 1 | 5 | 1 | 1 | 0.5912589690023613 | 0.6763970484247519 | 1 | 1 | 0.663007483143763 | 0.6390204490488842 | 1 | 1 | 0.7415098391990641 | 0.5714717411858903 |
| 1 | 6 | 0 | 1 | 0.5581282381803598 | 0.6863740909636928 | 0 | 1 | 0.683212073997938 | 0.6244245371633372 | 1 | 1 | 0.5866428577684434 | 0.6780571538802321 |
| 1 | 7 | 1 | 0 | 0.6238249554755368 | 0.6621605366785666 | 1 | 1 | 0.7259177163181333 | 0.5872770290723142 | 1 | 0 | 0.5926290883496039 | 0.6758873530924225 |
| 1 | 8 | 0 | 0 | 0.6956058598464008 | 0.6145416020897732 | 0 | 0 | 0.5937792849254486 | 0.6754534673458983 | 1 | 1 | 0.5080388909248926 | 0.6930179274544565 |
仅展示前 8 行,完整表格已保留在本地分享包中。
missing scenario table
| 缺失类型 | 缺失比例 | 重复次数 | 效价准确率 | 唤醒度准确率 | 支配度准确率 | 平均准确率 | 平均准确率标准差 | 平均准确率95%CI下限 | 平均准确率95%CI上限 | 效价准确率下降 | 唤醒度准确率下降 | 支配度准确率下降 | 平均准确率下降 | 平均准确率下降标准差 | 下降95%CI下限 | 下降95%CI上限 | 非负平均准确率下降 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 导联 | 0.1 | 161 | 0.5200138026224987 | 0.640441683919945 | 0.6821946169772253 | 0.6142167011732229 | 0.09206414071174945 | 0.5999955865352904 | 0.6284378158111554 | -0.010351966873706002 | -0.00034506556245686215 | -0.010697032436162874 | -0.007131354957441911 | 0.04671395457419611 | -0.01434724268587681 | 8.453277099298908e-05 | 0.0 |
| 导联 | 0.2 | 161 | 0.5244996549344378 | 0.6345755693581782 | 0.687370600414078 | 0.6154819415688981 | 0.09800206476398204 | 0.6003435979425092 | 0.630620285195287 | -0.014837819185645263 | 0.005521048999309873 | -0.01587301587301588 | -0.008396595353117093 | 0.05477657225148929 | -0.0168579127285804 | 6.472202234621485e-05 | 0.0 |
| 导联 | 0.3 | 161 | 0.5265700483091792 | 0.6369910282953763 | 0.6942719116632157 | 0.6192776627559237 | 0.09566308729594446 | 0.6045006201361086 | 0.6340547053757387 | -0.016908212560386455 | 0.0031055900621118045 | -0.02277432712215322 | -0.012192316540142627 | 0.06008201948808761 | -0.021473164438281393 | -0.0029114686420038585 | 0.0 |
| 导联 | 0.4 | 161 | 0.5341614906832304 | 0.6463077984817117 | 0.6918564527260174 | 0.6241085806303197 | 0.09555099581105339 | 0.6093488527417805 | 0.6388683085188589 | -0.024499654934437554 | -0.006211180124223598 | -0.020358868184955147 | -0.01702323441453876 | 0.061068137081426915 | -0.026456407541946416 | -0.007590061287131102 | 0.0 |
| 脑区 | 0.1 | 161 | 0.5241545893719811 | 0.6428571428571431 | 0.6901311249137333 | 0.619047619047619 | 0.09167869089006288 | 0.6048860447047351 | 0.6332091933905029 | -0.01449275362318841 | -0.002760524499654936 | -0.01863354037267081 | -0.01196227283183805 | 0.04275381814025649 | -0.018566439712464924 | -0.005358105951211175 | 0.0 |
| 脑区 | 0.2 | 161 | 0.5224292615596965 | 0.6459627329192548 | 0.6890959282263628 | 0.6191626409017714 | 0.09761346780865975 | 0.6040843237070297 | 0.6342409580965132 | -0.012767425810904069 | -0.005866114561766742 | -0.01759834368530021 | -0.012077294685990338 | 0.04856747907660418 | -0.019579495676344358 | -0.0045750936956363165 | 0.0 |
| 脑区 | 0.3 | 161 | 0.5220841959972397 | 0.6570048309178749 | 0.6915113871635605 | 0.6235334713595584 | 0.09207672027897915 | 0.6093104135604093 | 0.6377565291587075 | -0.01242236024844719 | -0.01690821256038647 | -0.020013802622498276 | -0.016448125143777317 | 0.054699962133661684 | -0.02489760858194833 | -0.007998641705606305 | 0.0 |
| 脑区 | 0.4 | 161 | 0.5365769496204282 | 0.6432022084196003 | 0.6922015182884743 | 0.6239935587761675 | 0.09488015593986521 | 0.6093374552807753 | 0.6386496622715596 | -0.02691511387163562 | -0.0031055900621118006 | -0.02070393374741201 | -0.016908212560386472 | 0.06229876053265659 | -0.02653147964881702 | -0.007284945471955923 | 0.0 |
仅展示前 8 行,完整表格已保留在本地分享包中。
nested feature selection
| 测试被试 | 筛选特征数 | 关键特征 |
|---|---|---|
| 1 | 30 | T7-γ频段功率;T8-γ频段功率;FC5-β频段功率;AF4-α频段功率;P8-α频段功率;O1-θ频段功率;T7-α频段功率;T8-α频段功率;P8-γ频段功率;F8-α频段功率;P8-β频段功率;T7-θ频段功率;P8-θ频段功率;F7-α频段功率 |
| 2 | 30 | T7-γ频段功率;T8-γ频段功率;FC5-β频段功率;AF4-α频段功率;P7-β频段功率;O1-α频段功率;P8-γ频段功率;P8-α频段功率;F7-β频段功率;T8-α频段功率;P8-β频段功率;F8-α频段功率;AF3-α频段功率;T8-θ频段功率 |
| 3 | 30 | T7-γ频段功率;FC5-β频段功率;T8-γ频段功率;F7-β频段功率;P8-α频段功率;T8-α频段功率;P7-β频段功率;AF3-γ频段功率;T7-α频段功率;P8-γ频段功率;AF3-β频段功率;P8-β频段功率;FC5-γ频段功率;O1-θ频段功率 |
| 4 | 30 | T7-γ频段功率;T8-γ频段功率;FC5-β频段功率;P8-γ频段功率;FC5-γ频段功率;T7-θ频段功率;AF4-θ频段功率;AF4-α频段功率;P7-γ频段功率;AF3-γ频段功率;F7-α频段功率;T8-θ频段功率;P7-β频段功率;F8-θ频段功率 |
| 5 | 30 | T8-γ频段功率;T7-γ频段功率;FC5-β频段功率;P8-α频段功率;F7-β频段功率;P8-β频段功率;P8-γ频段功率;AF4-α频段功率;O1-θ频段功率;O1-α频段功率;P7-β频段功率;T8-α频段功率;T7-α频段功率;AF3-γ频段功率 |
| 6 | 30 | T8-γ频段功率;FC5-β频段功率;T7-γ频段功率;AF4-α频段功率;O1-α频段功率;T8-α频段功率;P8-α频段功率;P7-β频段功率;T8-θ频段功率;T7-α频段功率;F7-α频段功率;O1-θ频段功率;P8-γ频段功率;F8-α频段功率 |
| 7 | 30 | T7-γ频段功率;T8-γ频段功率;FC5-β频段功率;AF4-α频段功率;FC5-γ频段功率;P7-β频段功率;F7-β频段功率;P8-α频段功率;P8-β频段功率;F8-α频段功率;FC6-β频段功率;T7-β频段功率;T8-α频段功率;P8-γ频段功率 |
| 8 | 30 | T7-γ频段功率;T8-γ频段功率;FC5-β频段功率;AF4-α频段功率;P8-α频段功率;F7-β频段功率;P8-β频段功率;P8-γ频段功率;P7-β频段功率;F8-α频段功率;O1-α频段功率;T8-α频段功率;T7-α频段功率;F7-α频段功率 |
仅展示前 8 行,完整表格已保留在本地分享包中。
reliability table
| 测试被试 | 维度 | 正确样本预测熵 | 错误样本预测熵 | 平均置信度 | 校准误差 |
|---|---|---|---|---|---|
| 1 | 效价 | 0.6761155609834254 | 0.6759996001820123 | 0.575879526607339 | 0.1869906377184501 |
| 1 | 唤醒度 | 0.6410185743917347 | 0.6485800445648319 | 0.6484967719779581 | 0.07372545024426415 |
| 1 | 支配度 | 0.6639713820390205 | 0.683370122600201 | 0.5891651854063917 | 0.07750148126027488 |
| 2 | 效价 | 0.685685296976749 | 0.6870867142749286 | 0.544201401613768 | 0.1967982676066761 |
| 2 | 唤醒度 | 0.6554476676581872 | 0.6738155509468209 | 0.6022019982079748 | 0.022908467218890123 |
| 2 | 支配度 | 0.6620586169995195 | 0.6686616522779546 | 0.605851417936057 | 0.06081524873060964 |
| 3 | 效价 | 0.6840924724455172 | 0.6841081446553574 | 0.5556171181306202 | 0.333394895908398 |
| 3 | 唤醒度 | 0.679232071811717 | 0.6800116517911282 | 0.5720609007147067 | 0.12761645627026233 |
仅展示前 8 行,完整表格已保留在本地分享包中。
result table
| 测试被试 | 测试样本数 | 效价准确率 | 唤醒度准确率 | 支配度准确率 | 三任务平均准确率 | 环形几何误差 | 能量对齐误差 | 相关结构误差 | 一致性误差 | 特征分布偏移 | 标签分布偏移 | 预测熵均值 | 校准误差均值 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 18 | 0.3888888888888889 | 0.7222222222222222 | 0.6666666666666666 | 0.5925925925925926 | 0.21490581545216805 | 0.0024657421555523474 | 0.4089503371924767 | 0.6263218948001971 | 0.22316767904665002 | 0.22895622895622894 | 0.663200435905042 | 0.11273918974099638 |
| 2 | 18 | 0.3888888888888889 | 0.6111111111111112 | 0.6666666666666666 | 0.5555555555555555 | 0.21576211538116663 | 0.03983506844647907 | 3.1242883264576537e-06 | 0.2556003081159721 | 0.23466304240138633 | 0.22558922558922564 | 0.6711306935998375 | 0.09350732785205862 |
| 3 | 18 | 0.2222222222222222 | 0.4444444444444444 | 0.6111111111111112 | 0.4259259259259259 | 0.1809425573877277 | 0.030721868558801324 | 0.07821811261874614 | 0.2898825385652751 | 0.3793092558217006 | 0.2676767676767677 | 0.6801099044511084 | 0.1931137647061035 |
| 4 | 18 | 0.5 | 0.7222222222222222 | 0.6111111111111112 | 0.6111111111111112 | 0.23730318955504914 | 0.021053325827254405 | 0.00010958843385818555 | 0.2584661038161617 | 0.2612567549795871 | 0.26767676767676774 | 0.6640462420161355 | 0.1838937238350903 |
| 5 | 18 | 0.4444444444444444 | 0.6111111111111112 | 0.7777777777777778 | 0.6111111111111112 | 0.1730862121269754 | 0.11121729588650942 | 0.00022986332451403613 | 0.28453337133799883 | 0.2003100852881701 | 0.03535353535353535 | 0.6785188344382234 | 0.1240040765876696 |
| 6 | 18 | 0.4444444444444444 | 0.6666666666666666 | 0.7222222222222222 | 0.6111111111111112 | 0.20572438960198478 | 0.061269448101621174 | 0.2699391967976619 | 0.5369330345012678 | 0.2096258298720481 | 0.35185185185185186 | 0.6665935031081186 | 0.12641580455553078 |
| 7 | 18 | 0.5 | 0.8333333333333334 | 0.5555555555555556 | 0.6296296296296297 | 0.2610228438354463 | 7.563055300826184e-05 | 0.03636908672872564 | 0.2974675611171802 | 0.3945648729693521 | 0.34175084175084175 | 0.6726610999934578 | 0.15759933631413767 |
| 8 | 18 | 0.6111111111111112 | 0.5555555555555556 | 0.6666666666666666 | 0.6111111111111112 | 0.21834739897149094 | 0.01399575502852929 | 0.040872268802183 | 0.27321542280220323 | 0.22832566359449288 | 0.16161616161616166 | 0.6715233402122273 | 0.11188087882291727 |
仅展示前 8 行,完整表格已保留在本地分享包中。
risk coverage curve
| 维度 | 覆盖率 | 保留样本数 | 平均置信度 | 准确率 | 风险 |
|---|---|---|---|---|---|
| 效价 | 1.0 | 414 | 0.5686029826517496 | 0.5096618357487923 | 0.4903381642512077 |
| 效价 | 0.9 | 373 | 0.5754509933491168 | 0.5013404825737265 | 0.49865951742627346 |
| 效价 | 0.8 | 332 | 0.5826478088389504 | 0.5090361445783133 | 0.49096385542168675 |
| 效价 | 0.7 | 290 | 0.5905003647291629 | 0.5206896551724138 | 0.47931034482758617 |
| 效价 | 0.6 | 249 | 0.5989663983551774 | 0.5220883534136547 | 0.47791164658634533 |
| 效价 | 0.5 | 207 | 0.6087691204315402 | 0.5120772946859904 | 0.4879227053140096 |
| 唤醒度 | 1.0 | 414 | 0.5946949034978799 | 0.6400966183574879 | 0.3599033816425121 |
| 唤醒度 | 0.9 | 373 | 0.6040870725691532 | 0.646112600536193 | 0.353887399463807 |
仅展示前 8 行,完整表格已保留在本地分享包中。
通用版论文完整预览大图
通用版论文完整预览大图
图6-3 模型性能对比柱状图
图7-1 个体差异气泡散点图
图7-2 留一被试识别表现小提琴图
图7-3 缺失场景性能变化面积图
图7-4 置信度错误率分箱曲线图