B题的所有三小问解答均已完成,可视化结果+可执行代码。
摘要
本文围绕 AI 生成图像与视频质量评价问题展开研究,研究对象包括附件 1 中 8 张 AI 生成图像和附件 2 中车内视角车流视频。针对图像无参考评价缺少真实参照、图文一致性与成像质量难以统一度量、视频质量受时序波动影响等特点,构建了由语义保真度、技术质量、结构完整性、时序稳定性共同组成的评价框架,并结合极差归一化、加权综合、分位阈值划分、跨模型一致性检验及时序失稳判定完成质量评估。
针对问题一,本文将 AI 生成图像质量评价转化为多维指标综合评价问题。围绕提示词语义、灰度统计、频域异常、边缘连通与轮廓紧致度构建 NR-IQA 指标体系,分别得到语义保真度、技术质量和结构完整性,再通过加权合成得到综合质量指数。求解结果表明,图8 以综合质量指数 0.6129 获得最高评价,图4 以 0.1385 处于最低水平,模型能够区分语义优势型、多维均衡型和结构优势型样本。
针对问题二,本文在问题一连续评分基础上构建质量等级判定与可靠性分析模型。利用综合质量指数分布确定高、中、低等级阈值,并以内容类型为分组变量计算各维度均值与敏感性极差;同时引入 NIQE-like 与 BRISQUE-like 两类自然场景统计替代模型,通过 Pearson 相关系数和 Spearman 秩相关检验跨模型一致性。结果显示,高质量样本为图8、图5、图7,结构完整性对内容类型最敏感,综合质量指数对类型差异具有一定平衡作用。
针对问题三,本文将静态图像质量评价扩展到视频帧序列时域评价。围绕单帧质量、分层光流连续性、区域内容一致性和亮度色彩闪烁抑制建立视频质量模型,并通过阈值触发机制识别局部与全局时序失稳。附件 2 视频的全局光流损失、内容一致性损失和闪烁损失均未超过阈值,综合时序质量也未低于判定阈值,因此全局层面未出现显著时序失稳;局部失稳帧对比例为 10.34%,惩罚后视频质量为 0.357652。
全文模型形成了从图像静态质量评价到视频时序质量判定的闭环框架。多维指标体系兼顾语义、技术、结构与时序约束,等级划分和跨模型检验增强了结果解释性,区域分层机制提高了视频场景适配性,能够较全面地回答题设质量评估任务。
关键词 :无参考图像质量评价;综合质量指数;内容类型敏感性;跨模型一致性;时序失稳判定
问题重述
问题背景
本课题围绕"AI 生成内容的质量评估与参数优化"展开,聚焦扩散模型等生成式 AI 在图像与视频内容生产中的质量评价问题。随着 AIGC 技术在影视制作、广告设计、教育培训等领域的广泛应用,如何在无参考条件下客观衡量 AI 生成图像的语义保真度、技术质量与结构完整性,并进一步刻画视频在时间维度上的运动连续性、内容一致性和闪烁抑制水平,成为评价生成模型效果与指导参数优化的关键。题目提供的多类型、多风格 AI 生成图像及车流场景视频为建模提供了基础数据与典型应用场景,有助于系统分析生成内容在不同内容类型和动态环境下的质量特征与时序稳定性问题。
问题一要求在无参考条件下构建一套系统的图像质量评价数学模型。具体需要将文本提示词分解为主体对象、属性描述、场景关系、风格指令四类语义要素,利用 CLIP 语义相似度或关键词匹配率度量生成图像与文本提示之间的语义保真度;同时基于自然场景统计特征或频域分析建立反映清晰度、噪声、伪影等因素的技术质量指标,并通过边缘连续性、形状规则性等特征刻画图像的结构完整性。在此基础上构建加权综合质量指数,对各维度指标及权重参数的物理或统计含义做出明确解释。
问题二在问题一模型的基础上,要求设计具体的图像质量评估算法,并将其应用于附件 1 中的 8 张 AI 生成图像。需要结合写实风景、人物肖像、艺术插画、产品渲染四类内容以及高、中、低三档质量等级,对每幅图像给出语义保真度、技术质量、结构完整性及综合质量的定量评估结果,分析不同内容类型在各质量维度上的敏感性差异,并通过与其他质量评价方法或模型的对比,检验所提出模型与算法的稳定性与可靠性。
问题三面向视频质量,要求建立以时序连贯性为核心的视频质量评估模型。需要从光流连续性、内容一致性、闪烁检测三方面刻画相邻帧之间运动向量的平滑程度、同一物体特征在时间上的稳定性以及亮度和色彩突变情况,并在理论上推导产生时序失稳的必要条件,分析时序失稳对整体视频质量评价的影响。基于所建模型与算法,对附件 2 的车流视频进行定量分析,判断其是否存在时序失稳现象,并给出视频时序质量及综合质量的评估结果。

问题一模型建立与求解
问题一的本质是将无参考图像质量评价转化为多维可计算指标的综合评价问题。针对每张 AI 生成图像,需要同时刻画文本提示词与画面内容的一致程度、图像自身的技术成像质量以及物体结构的完整程度,并将三类异质指标统一到可比较的数值尺度。为此,本文围绕语义要素、频域与空间统计特征、边缘与轮廓结构建立指标体系,在权重约束下构造综合质量指数,用于完成附件 1 中 8 张图像的定量评价与质量排序判断。
问题一模型建立
语义要素结构化与保真度刻画
设待评价图像集合为 ,每张图像对应文本提示词 。根据题意,将
解析为主体对象、属性描述、场景关系、风格指令四类语义要素,记为
,其中
分别对应上述四类要素。该划分使文本约束由整体自然语言转化为可分别评价的语义子目标,避免仅以单一文本相似度掩盖主体缺失、风格偏离或空间关系错误等问题。

这里仅展示部分内容,,,完整下面获取传送门
通过网盘分享的文件:中青杯资料获取入口
链接: https://pan.baidu.com/s/1VT31eEcwz4jx1VIckwjWBA 提取码: 6666
--来自百度网盘超级会员v6的分享
