【探展WAIC】从“眼见为虚”到“AI识真”：如何用大模型筑造多模态鉴伪盾牌

2012年 Photoshop CS6 的"内容感知填充"把专业修图时间从天降到分钟，2018 年 StyleGAN 让"一键换脸"在消费级显卡上第一次跑通，2023年 Stable Diffusion、Midjourney 横空出世，只需一句话即可生成带环境光、带景深、带物理反射的图像或视频。

随着人工智能技术的飞速发展，特别是多模态大模型和生成式AI的普及，数字内容的创作与传播已然变得前所未有的便捷。然而，硬币的另一面是，AI也为伪造和篡改带来了新的挑战。从逼真的人脸视频到以假乱真的图像，伪造内容正日益渗透到金融、政务、社交等多个领域，对个人隐私、经济安全乃至社会信任体系构成了严峻威胁。

在2025年世界人工智能大会（WAIC）上，"真假之辨"成为多模态AI应用令人关注的议题之一。作为WAIC展会现场的亮点之一，合合信息展出了其多项领先的AI鉴伪技术方案------从换脸识别到AIGC图像鉴定，再到票据文档篡改检测，展示了如何借助大模型能力构建多模态、可解释、鲁棒的鉴伪系统。

一、AI伪造篡改挑战

1.1、深度伪造（Deepfake）技术的滥用

深度伪造（Deepfake）技术始于2014年，其最开始利用生成对抗网络（GAN）等深度学习模型生成逼真的图像或视频。随着生成式AI模型（如VAE、GAN、扩散模型）的快速发展，合成内容的真实度不断提升，大模型已经能够无师自通地生成高分辨率的人脸、风景及场景，甚至能够合成自然的声纹，将视频和声音同时伪造出来。

与此同时，深度伪造技术已在金融诈骗、情色犯罪等领域泛滥。去年2月，在香港就曾发生因伪造视频会议而造成员工损失数百万美元的案件。此外，生成式AI还被用于制作色情图片和视频，尤其针对私人名人或普通人进行"换脸"侵犯隐私。可以说，以"Deepfake"为代表的伪造技术一方面为内容创作带来便利，另一方面也对社会信任、公民隐私、安全审查等造成严重冲击，亟需技术与制度的多重防护。

1.2、图像与文档篡改的隐蔽性挑战

除了视频换脸之外，静态图像和文档内容同样面临日益精密的伪造手段传统图像篡改方式如复制粘贴、拼接或擦除，往往会在画面中留下边缘不整、色彩不均等细微痕迹。然而，随着AI图像生成技术的快速普及，越来越多伪造内容已经不再依赖真实素材，而是"无中生有"地直接生成，欺骗性更强，识别难度更高。

即使是看似简单的卡证信息篡改，也可能牟取巨额利益，2024年5月，某法院审理的一起案件中，被告就开发了"行驶证美化"模块，用户上传原始行驶证照片后，该模块自动生成带有官方版式和印章的全新伪造行驶证。据调查，该模块被大规模滥用，最终有多人通过它批量生成了超过20万张伪造驾驶证，用于违规代扣分，非法获利超过30万元。在二手车交易等业务中，造假者通过伪造车辆登记证、行驶证上的车架号、发动机号等关键字段实施合同诈骗，也会造成企业重大经济损失。

这些伪造手段具有高度的隐蔽性 。一方面，不法分子可以利用图像增强、AI生成等技术，使伪造痕迹与周围背景高度融合，不易被肉眼察觉。另一方面，文档伪造往往只修改少量文字或数字，但这些字段与原文高度相似，识别难度大。此外，社交媒体对图像的二次压缩、裁剪也使伪造证据更难保留。从证件身份到商业凭证，一旦伪造图像进入审核流程，将给金融、保险、政务等多行业造成潜在风险。

1.3、多模态内容的复杂性挑战

当前的数字内容越来越呈现出多模态融合的特征，视频、音频、图像、字幕与文本等信息形式往往被打包成一个整体。伪造手段也不再局限于某一媒介，而是向跨模态、协同操控演变。一段视频可能同时被篡改画面与语音内容；一则新闻帖文也可能通过配图、评论等多个层面同步植入虚假信息。攻击者可针对任意维度下手，或采用多点联动的方式实施混合型伪造。

这种内容形态的复杂性无疑为检测机制带来了更多挑战。这意味着，仅靠传统单模态方法难以全面识别伪造，必须针对不同类型的内容和应用场景，制定有针对性的检测策略。

二、AI鉴伪技术原理

随着伪造技术的不断演进，AI在内容真伪识别中的作用也日益凸显。当前主流的AI鉴伪方法主要围绕图像的底层视觉特征、语义内容合理性以及多模态信息融合展开，从不同层次挖掘图像中的异常线索。

2.1、基于视觉特征的鉴伪分析

视觉特征分析是识别伪造图像的基础手段。许多合成图像虽然在视觉上难以察觉，但常常在像素层面或频域中留下细微伪影，这些"肉眼不可见"的痕迹可被算法有效捕捉。

以MIT媒体实验室的研究为例，其总结的深度伪造图像特征包括：不自然的眨眼频率与嘴部运动节奏、眼镜与眼球反射不一致，以及皮肤、眼睛、头发间年龄信息的不协调等。其中一个常见判断标准是双眼反光是否对称：若反光高度一致，图像往往真实可信，反之则可能为合成内容。

针对上述细节，现代图像鉴伪系统普遍采用深度神经网络自动学习并提取高阶视觉特征。

一方面，这类模型能够"锚定"人眼难以察觉的细粒度差异，为图像中的每个像素赋予真假标签并输出伪造概率；
另一方面，在应对图像拼接、局部编辑等复杂篡改时，也能捕捉到纹理断裂、噪声不连贯等微妙异常，从而提升检测精度。

除此之外，在实际应用场景中，被检测图像往往已经过多轮压缩、缩放、裁剪或社交平台的重编码处理，画质损耗显著，进一步加大了伪造识别的难度。为此，合合信息推出的AIGC图像鉴别技术在抗干扰能力上具备显著优势。该系统可在图像经历复杂传输链路后，仍精准识别潜藏的异常特征，为多行业内容安全提供坚实技术支撑。

2.2、基于图像内容合理性的判断

除了底层视觉特征外，内容层面的合理性检验也是鉴伪的重要思路。AI生成或编辑的图像有时在语义或物理上留下不合常理之处，例如不合理的透视、纹理、光影矛盾或逻辑错误。

合合信息的AIGC图像鉴别技术通过多层级提示机制，对图像中的透视关系、光影方向与物体空间位置等要素进行合理性分析，从而识别潜在的伪造痕迹。在针对DeepFake换脸内容时，系统重点关注面部细节与语义层面的异常表现，例如皮肤纹理的连续性、表情是否自然、面部对称性是否异常，以及眼部高光与反射是否真实可信。

通过融合视觉推理与几何物理知识，该方法不仅依赖像素级痕迹识别，更着眼于图像内容内部的结构一致性和逻辑合理性。在合成图像愈发精细、低层次"失真"难以察觉的背景下，这类基于高层语义与物理约束的推断机制，正成为图像鉴伪的关键手段。

2.3、多维度交叉验证与融合

随着伪造技术日趋复杂，单一检测手段已难以应对当前的鉴伪挑战。因此，现代检测方案普遍采用多模态、多模型融合的策略，以提升系统的鲁棒性与适应性。北京大学等研究机构提出的FakeShield框架便是典型示例：该方法通过对齐图像与文本特征，联合输出伪造区域掩膜与语义解释，在提升检测准确性的同时，也增强了系统的可解释性与泛化能力。

合合信息的人脸鉴伪团队同样采用了类似策略，在其检测框架中融合多模态输入与多模型路径，聚焦图像的不同特征维度进行交叉验证。这种多维度融合机制使系统在面对伪造者针对某一维度进行优化时，仍可从其他角度捕捉异常线索，形成更为稳健的判断依据。同样，在卡证识别中，该技术不仅分析图像的空间域特征，还提取频域信息，利用多维度特征判断是否为AI生成。

三、合合信息的AI鉴伪产品体验

在本届WAIC世界人工智能大会上，合合信息展示了其在涵盖人脸视频篡改识别、图像真伪判断以及文本图像篡改检测等多种AI安全最新产品和应用场景。

3.1、人脸视频篡改检测：实时洞察"数字假面"

在展台现场，合合信息以互动形式呈现了人脸伪造检测的核心能力。现场演示中，系统先对参观者进行面部扫描，然后实时生成一个基于AI算法的"数字假面"，尽管伪造面容在表情和细节上近乎完美重现，合合信息的人脸鉴伪模型仍能在毫秒级内将其精准识别。团队介绍说，该模型通过持续增量学习，针对主流换脸算法不断同步更新，多层次检测方案可实现毫秒级响应。

具体而言，对于人脸图像交换伪造，模型可以锚定人眼难以察觉的高级视觉差异，为每个像素打上真伪标签并计算伪造像素占比，从而给出整张图像的真伪概率评分。若遇到更复杂的AI直接合成图像，系统则会并行部署多种神经网络，从多维度特征进行验证，使判断结果更加精确。凭借这一技术，合合信息能够实现对换脸视频的实时监测，为"数字假面"提供强大的防护。

3.2、AIGC图像鉴别：秒辨名画真伪

在另一区域，合合信息展示了AIGC图像鉴别技术 。现场演示采用"大家来找茬"的形式，系统加载经过大模型加工的世界名画图像如《蒙娜丽莎的微笑》，对其进行增添元素或微调色彩，使伪造痕迹对肉眼几乎隐蔽。背后采用的是多模态大语言模型（MLLM）能力，通过不同层级的提示词（prompts）和多视角分析，该系统不仅提取图像的频域特征，还推理其透视关系、光影角度等合理性因素。经过推理判断后，如果图像中的内容存在语义或结构上的异常，系统会输出结论并用"假"字样标注该图像。

合合信息团队介绍，目前该系统已能实现毫秒级鉴伪，能有效识别由MidJourney、Stable Diffusion、StyleGAN、GPT-4o等主流生成模型产出的图片。简言之，通过对图像内容进行合理性分析和频域对比，合合信息的AIGC图像鉴别技术让隐藏在视觉幻象背后的事实无所遁形。

3.3、TextIn通用篡改检测平台

针对静态文档和凭证类图像，合合信息在本次展会中还展示了其TextIn通用篡改检测平台。该平台基于深度学习与跨模态分析技术，支持对身份证、驾驶证、发票、报销单据等多种类型的图像与文本进行内容真实性校验。据现场工作人员介绍，TextIn采用自研的篡改检测模型，能够快速识别图像中的异常变动，准确判断是否存在篡改痕迹，并精确标记可疑区域。

这一技术已广泛应用于金融、保险和政务等领域。例如在驾驶证和行驶证的校验场景中，系统能捕捉证件信息中微小的异常；在银行开户、信用卡申请、保险理赔及报销审核等流程中，也有效发挥了图像鉴伪能力，协助机构识别伪造材料、规避潜在风险。

TextIn平台在性能表现上同样具备优势：其核心模型支持毫秒级响应，在不同业务场景下仍能保持极低误检率，最低可控制在千分之一以内。平台既支持通过云端API接入，确保数据安全不外泄，通过这一系统化方案，合合信息为文档和凭证类图像的可信处理提供了稳定可靠的技术保障，助力各行业提升内容风控能力。

四、总结

在2025 WAIC现场，可以看到生成式AI不仅释放了内容创作的潜力，也让"视觉真相"变得更加模糊。合合信息展示的多模态、大模型鉴伪解决方案，正是为应对这场"真假攻防战"而生。

从换脸视频识别到AIGC图像鉴定，从证件篡改检测到跨模态融合验证，AI不再只是伪造的帮凶，更正在成为守护真实性的核心力量。

未来，随着内容边界持续模糊，AI鉴别的能力将成为社会运行中不可或缺的"数智盾牌"。我们期待，更多像合合信息这样的技术团队，能在"识真"之路上持续前行，用AI筑牢信任的底座。

点击链接在线体验鉴伪技术：cc.co/16YSUi，可获取1000次图像处理免费体验额度。