在保利香港拍卖 2025 春季拍卖会中,「清雍正粉彩及珐琅彩梅竹先春祝寿图碗」的拍卖估价飙破 880 万港币,「明永乐青花竹石芭蕉图梅瓶」更是在佳士得 2025 年香港春季拍卖会以 7812.5 万港币的高价成交。此前,在 2017 年香港苏富比的秋季拍卖会上,「北宋汝窑天青釉洗」在经过 30 多次叫价后以 2.6 亿港币落槌,加上佣金后总计拍出了 2.94 亿港币的天价,被匿名亚洲私人藏家投得,刷新了当时中国瓷器的世界拍卖纪录。
不难窥见,陶瓷文物在全球范围内展现出巨大的经济潜力 。 与此同时,陶瓷也渗透到了人们生活的方方面面,除了常见的餐具、瓷砖之外,也走进了电子产品、医疗器械/植入物等领域。统计数据显示,自 2017 年至 2023 年,中国日用陶瓷年产量从 491 亿件增长到至 679 亿件,全球陶瓷市场规模预估还将以 4.4% 的复合年增长率(CAGR)继续扩大。 陶瓷商品交易的持续增长带来了庞大的估值需求,而传统的陶瓷分类方法却限制了非专业人士参与这项工作。
回顾陶瓷分类的研究实践,传统陶瓷分类方法多存在缺乏适应性和可解释性等局限。 经验识别缺乏统一的量化标准,高度依赖「眼学」,可能因认知差异的分歧导致分类模糊,同一件陶瓷在不同的专业人士手中可能出现大幅度的估值差异,同时对仿品的辨识度不足;而 X 射线荧光、热释光定年和光谱分析等精确识别高度依赖复杂仪器。
随着深度学习和计算机视觉技术的快速发展,基于特征提取、图像分割和图像增强等方法的陶瓷分类日益普遍。目前,对陶瓷自动化分类的研究已实现利用卷积神经网络(CNNs)、迁移学习以及胶囊网络,使用视觉属性对陶瓷进行了自动化分析, 通常局限于基本的纹理识别,难以将陶瓷的历史、美学等影响估值的文化因素纳入计算框架, 同时缺乏非专业爱好者可操作的分类工具。
在此背景下,马来西亚博特拉大学研究团队联合新南威尔士大学悉尼分校,基于 YOLOv11 模型共同提出了兼具高预测性能和可解释性的智能框架, 将视觉建模和经济推理相结合,用于陶瓷文物自动分类及其市场价值估测。 改进后的 YOLOv11 模型能够将瓷器的工艺属性输入随机森林分类器,基于佳士得、苏富比、保利拍卖和中国嘉德等机构多年拍卖数据对陶瓷文物进行估值。
该研究成果以「Integrating deep learning and machine learning for ceramic artifact classification and market value prediction」为题,发表于 Nature Partner Journals 。
研究亮点:
-
建立了稳健的数据驱动框架,能够整合艺术特征和市场数据准确评估陶瓷文物,为陶瓷分类及估值提供更为系统客观的方法;
-
增强了 YOLO 模型在检测和分类陶瓷类型方面的性能,优化 YOLO 模型在陶瓷分类后续估值任务中的输出;
-
结合基于 YOLO 模型提取的特征和结构化拍卖数据,使用随机森林分类器预测价格,提高预测结果的准确性与可解释性。

论文地址:
关注公众号,后台回复「陶瓷」获取完整 PDF
更多 AI 前沿论文: go.hyper.ai/owxf6
三阶段集成:数据标注、陶瓷分类和价格预测
该研究建构的分类框架包括 3 个连续阶段:数据标注、基于 YOLOv11 模型的陶瓷分类和基于随机森林回归模型的价格预测。

分类框架流程图
数据集标注:AI 预处理与专家修正的混合标注方案
该研究基于形状、纹样和生产工艺的三层陶瓷分类框架建立了高质量陶瓷图像数据集。该数据集包含 8,213 张高分辨率图像,图像涵盖了 20 种不同的特定窑系和装饰技法风格,并按照 7:2:1 的比例划分为训练数据、验证数据和测试数据。
图像数据主要来自 3 个渠道: 一是佳士得、苏富比、邦瀚斯、中国嘉德、保利拍卖、北京荣宝斋等拍卖行(42.6%,3500 幅);二是博物馆及文物数据库(24.3%,2000 幅),包括故宫博物院、大英博物馆、大都会艺术博物馆、中国国家博物馆、国际博物馆协会数据库等;三是陶瓷艺术品商店及实地摄影作品(33.1%,2713 幅),主要来源于淘宝、闲鱼、亚马逊、 Pixabay 、维基共享资源等平台以及私人收藏家。
研究采用了混合数据采集方法,例如使用 Scrapy 框架进行自动化网页抓取,从公共数据库中提取结构化陶瓷图像数据。
数据集标注阶段主要采用 AI 自动采集与专家修正的标记策略,对高质量的陶瓷图像数据集进行标注:
-
AI 预标注: 利用 YOLO 预训练模型对初始材料进行检测,自动生成陶瓷轮廓的边界框;
-
人工标注与验证: 由陶瓷鉴定专家和数据研究人员使用 LabelImg 工具优化标注结果,根据工艺风格、器物形状、装饰图案进行三级分类。

工艺风格分类

器物形状分类

装饰图案分类
为了进一步提高模型鲁棒性并评估泛化能力,研究团队采用了 5 倍交叉验证,并且使用 K-means 聚类优化锚框尺寸以适应不同的陶瓷形状,从而提高检测精度。应用循环学习率调度器(Cyclic Learning Rate Scheduler)来稳定梯度更新,同时结合早停机制(Early Stopping)与模型检查点(checkpointin)以防止过度拟合。为了增强空间泛化能力,研究还使用了 Mosaic 、 GridMask 和 MixUp 图像增强技术进行验证。
YOLOv11 模型:引入注意力模块形成估价逻辑机制
在 AI 预处理的数据集基础上,改进后的 YOLOv11 模型将根据陶瓷的形状、纹样和生产工艺对图像进行分类。改进后的 YOLOv11 模型架构集成了 ResNet 主干网络、多个特征增强模块以及针对图案、形状和工艺风格等陶瓷属性优化后的检测头(Detection Head)。

改进后的 YOLOv11 模型架构
改进后的 YOLOv11 模型以 ResNet50 为主干网络。为提升模型对陶瓷视觉特征的表达和计算效率,本研究在结构上引入了 3 个增强模块:
-
C3k2-EIEM 模块: 该模块包含边缘信息学习、空间特征保留和特征融合策略三个关键组件,通过明确捕捉边缘信息并保留空间细节,保留高分辨率空间细节,增强对雕刻、铭文等细粒度装饰细节的检测;
-
快速空间金字塔池化(SPPF): 通过执行多维池化提取陶瓷不同维度下的视觉特征;
-
跨阶段局部注意力机制(C2PSA): 通过自适应调节权重减少图片背景干扰,从而聚焦关键装饰区域,增强模型对釉下彩绘、镂空雕花等复杂装饰的敏感度。
注意力增强模块的集成提高了模型对陶瓷高价值特征的识别能力。为链接分类结果输出和传统估值逻辑,本研究引入了梯度加权类激活映射(Grad-CAM)生成注意力模块的可视化图像,验证注意力模块的有效性。
随机森林回归模型:从视觉特征到货币价值评估
在价格预测阶段,研究设置了一个基于随机森林(RF)的回归模型,并采用基于分类的价格预测方法,根据提取的视觉特征系统预测陶瓷制品的收藏价值。随机森林回归模型对所采集视觉特征的分类流程分为四点:
-
类别特征: 对装饰纹样和工艺风格等分类特征使用 One-Hot 编码进行处理,将视觉特征转化为机器可读的数据化表达。
-
拍卖价格归一化与异常值处理: 将六大拍卖行 2000 年至 2024 年的陶瓷文物交易价格均根据历史汇率以及世界银行、经济合作与发展组织(OECD)等国际金融数据库公布的消费者物价指数(CPI)数据,折算并归一化为 2024 年的美元(USD),并采用四分位距(IQR)方法剔除拍卖价格数据中的异常值。
-
定量特征: 纳入形状、装饰纹样和工艺复杂性的自变量因素,以及价格区间的因变量因素,所有定量特征均采用最小-最大缩放法进行归一化。
-
数据编码: 实施结构化数据编码策略,使用独热编码(OHE)将非数值的离散值转化为二进制,使其能够被回归模型捕捉而无需引入人为的数值关系。
RF 分类模型在训练回归模型时则将流程分为数据预处理、特征提取、集成训练和预测四个阶段,在训练过程中构建多个决策树,每个决策树都基于数据的引导样本进行训练,以降低数据方差。

随机森林模型架构
研究结果:YOLOv11 与 RF 双驱,模型估值准确率提升
研究将改进后的 YOLOv11 模型与 YOLOv11 模型进行了性能评估,并对增强的功能模块进行了 5 倍交叉验证,同时评估了随机森林回归模型的估值逻辑及其准确率等性能指标。
首先是改进后的 YOLOv11 模型与 YOLOv11 模型在陶瓷分类方面的性能评估结果,关键检测指标包括平均准确率(mAP)、召回率(Recall)、准确率(Precision)和最佳 F1 得分(Best-F1)。实验结果表明,改进后的 YOLOv11 模型整体检测精度有所提高,减少了对形状或釉面细节的假阴性检测,最佳 F1 值提升 2% 。虽然准确率略有下降,但通过平衡假阳性和假阴性结果提升了模型的泛化能力。

改进后的 YOLOv11 模型与 YOLOv11 模型性能比较
为确保 C3k2-EIEM 增强型 YOLOv11 模型的稳健性和泛化能力,研究进行了 5 倍交叉验证,结果表明,增强的功能模块有助于实现更一致的分类性能。

交叉验证结果
随机森林回归模型性能评估标准包括准确率、精确率、召回率、 F1 分数和 AUC 。在训练集上,模型的准确率达到 99.65%,准确率、召回率和 F1 得分均为 99.65% 。在独立测试集上,模型的准确率为 98.91%,准确率、召回率和 F1 得分也均为 98.91%,在预测陶瓷市场价值类别方面表现稳健。

价格分类的 ROC 曲线分析
此外,随机森林回归模型强调工艺复杂性在市场价值上的影响,其估值逻辑与历史拍卖趋势一致。

随机森林模型中价格分类的特征重要性
AI 赋能,在数字时代延续窑火呼吸
AI 技术对陶瓷和文物行业的重构从未停止。此前,新加坡华人李鉴宸打造的鉴定系统,已推动以往耗时耗力的陶瓷分类进入了光速鉴定时代。该系统涵盖了约 200 万件文物数据,其采用的多光谱扫描技术和传统鉴定师的时以年计的「目测」相比,能够仅根据陶瓷釉面的气泡形态,对照时代工艺后即可完成断代分析。
值得一提的是,该系统还能通过多模态光谱成像捕捉隐藏的修复痕迹。 2025 年 5 月,李鉴宸团队就意外扫描发现台北故宫《早春图》覆盖层下的北宋题跋痕迹,使该文物的市场估值翻倍增长。
2024 年,北京大学考古文博学院科技考古实验室与北京壹据技术有限公司还合作开发了古陶瓷溯源在线分析系统。据悉,该项目覆盖了包括 100 多处知名窑址在哪的的古陶瓷釉面成分数据库,收集了近百万条陶瓷主微量元素数据,壹据技术开发的手持式 XRF 古陶瓷智能检测系统具有无损、便携、快速、高准确率等优点,已在多个重要考古遗址使用。
目前,AI 正不断革新陶瓷「经验议价」的行业生态,推动陶瓷向算法驱动模式行进。 AI 与陶瓷的碰撞,是一场技术对文明的承接与重塑,数字时代的全新脉动,将让千年瓷韵走向更广阔的时空维度。
参考链接:
1 、 www.prnewswire.com/apac/zh/new...
2 、 www.sohu.com/a/913181430...
3 、 www.sohu.com/a/199794691...
4 、 pff.szzit.cn/2d41
5 、 pff.szzit.cn/2d4A
6 、 ourl.cn/G2FTpz