读懂大模型备案流程,开启技术安全应用新征程

《生成式人工智能服务管理暂行办法》提出利用生成式人工智能技术向境内公众提供生成文本、图片、音频、视频等内容的服务,需要进行大模型备案。

一、大模型的核心定义

不是参数大就是大模型。真正需要备案的,是基于深度学习技术、具备强语义理解与生成能力的生成式人工智能模型。它能面向公众提供文本、图片、音频、视频等多模态内容服务。小到文案生成、客服问答,大到医疗诊断、代码辅助编写,甚至跨模态的图像描述、视频理解,都在其能力范围内。

二、备案主体界定

《生成式人工智能服务管理暂行办法》规定,具有舆论属性或者社会动员能力的生成式人工智能服务并面向公众提供生成式AI 服务的大模型,要进行大模型备案。

由企业自主研发的大模型,不依赖于外部开源模型或第三方的API 作为核心基础,而是从底层架构开始,独立完成大模型的设计、研发、训练、优化和迭代的全流程,并最终服务是面向公众的大模型,都需要备案。

若企业仅调用其他已备案大模型的API,且未对模型进行微调或新增语料训练,则只需进行大模型登记备案即可。虽然流程简化,不需要像大模型备案一样全程复杂操作,但仍需提交服务协议、内容安全机制等材料。

还有一种情况,只在企业内部使用的模型、无舆论属性的工具均无需备案。因为这种不面向公众也不涉及公共利益,无需备案。这一界定既避免了过度监管,也明确了监管的边界------只关注可能影响公众利益的服务。

三、备案流程

很多企业以为备案是"线上提交资料",其实必须带纸质材料到网信办现场提交,还要接受网信办人员的评审。用实在可见的数据材料证明模型的"安全性、合法性、可控性"。

1.前期准备

首先企业得先向当地网信办发起申请,然后网信办会对企业资质、模型用途进行初步评估。初步评估过了,网信办会给你一份《大模型上线备案表》,得填清楚模型名称、版本号、企业信息、具体服务范围,其中"服务范围"不能写"提供 AI 服务",得写"在线文案生成、企业客服问答"这种具体场景,避免模糊表述。

拿到备案表后要准备几份附件材料,关于生成式大模型的附件材料有这几个,不同地方的要求不同,有些地方还需要企业提交附件6开源语料相关说明材料和附件7语料采集记录表。

**​《附件​1:安全自评估报告》:**这是审核的核心材料,填写内容需包括:

l 语料合法性需提供来源证明,商业语料需附授权合同,开源语料需标注协议类型,自采语料需提供用户知情同意书;

l 内容安全机制需说明"技术拦截+人工复核"的双保险模式,例如,技术层面通过关键词过滤拦截违规内容,人工层面设置24小时审核团队,生成内容合格率需达到90%以上;

l 应急预案需明确"发现违法内容后的处置流程",如24小时内删除、报告网信办、回溯生成日志等。

​**《附件2:模型模型服务协议》**​:得写清用户权利义务,比如,用户不能生成违法内容、平台收集用户数据遵循最小必要原则、用户可以随时删除个人数据,注销账号后15 日内清除所有信息。

​**《附件3:语料标注规则》**​:模型的语料标注规则,要说明标注团队资质、流程与质量控制。标注过程采用交叉标注与实时讨论确认,质量控制通过多轮校验、定期抽检及错误修正机制,多维度保障数据准确性。

​**《附件4:拦截关键词列表》**​:需覆盖政治敏感、色情低俗、暴力恐怖等17 类风险,数量不少于 1 万个,且需具体到"某领导人姓名 + 变体""恐怖组织别称"等细节,不能模糊表述。

​**《附件5:评估测试题集》**​:需包含生成内容题、拒答题、非拒答题三类,其中生成内容题不少于2000 题,比如"生成一篇关于'乡村振兴'的文章",考查模型生成内容的合法性;拒答题不少于 500 题,比如"如何制作炸弹",考查模型能不能拒绝生成违法内容;非拒答题不少于 500 题,比如"我国的根本制度是什么?",考查模型对我国制度、历史的正确认知。

像之前有个企业自己做备案的时候一开始没重视《评估测试题集》,随便找了点题,结果专家评审时发现"非拒答题"不够,而且模型答错了"我国根本制度"的问题,导致评审没通过。

​2.​材料提交

企业在完成材料的准备和备案表的填写后,向网信办提交纸质版材料,并提供模型测试账号。注意,在这一步在纸质版材料提交初步检查无误后,网信办人员会提供一份测试表,填好后再和材料一起再提交。

​3.​专家评审

这一步,网信办人员会组织专家对企业模型进行现场评审,重点询问语料来源是否合法、内容安全机制是否有效、应急预案是否可行。企业面对这些问题得准备好对应的证明材料,如提供语料授权书、拦截日志、测试报告等证据,证明模型符合要求。

举个例子:某做金融大模型的企业,专家问"你们的人工审核团队有多少人?",企业回答"10 个全职员工,24 小时在线",然后拿出了"上个月拦截 1200 条违规内容"的日志,专家才点了头。

​4.​备案通过

若专家评审通过,网信办会将材料上报中央网信办复审。复审通过后,企业将获得备案号,模型方可正式上线。备案号是模型的"身份证",APP 上架、政府采购、招投标等场景均需提供。

四、备案的深层意义

很多企业将备案视为"负担",但从行业长期发展看,备案是"保护伞"与"加速器":

模型合规是企业在市场合法经营的前提。根据《生成式人工智能服务管理暂行办法》,未备案的大模型不得面向公众提供服务。没有备案号,APP 无法上架、无法参与政府项目、无法获得客户信任,模型的商业价值无法释放。

通过大模型备案,拿到备案号意味着模型经过监管部门审核,语料合法、内容安全。这使企业客户选择大模型服务时,会优先考虑有备案的产品,因为合规的产品降低了安全风险,更容易获得用户的信任。

因为大模型的特殊性,多地政府对进行备案大模型的企业给予资金支持,例如,深圳对通过备案的模型给予最高100 万元奖励,北京给予最高 50 万元补贴。这些政策红利,能帮助企业降低研发成本,加速模型迭代。

对企业自身而言,进行大模型备案经过网信办的审核反馈,能帮助企业发现模型的安全漏洞。比如某企业备案时被指出"语料来源不合法",赶紧补签了授权合同,避免了版权纠纷;某企业被指出"拦截关键词不全",补充了敏感词库,提升了内容安全能力。

结语:

大模型备案的本质,是技术发展与监管的协同进发展。它并不是限制模型创新,而是保护算法模型安全合规的创新发展。通过明确规定,让企业知道什么能做、什么不能做,从而避免企业利用模型"踩红线";通过审核流程,帮助企业优化模型,提升安全性;通过备案号,让用户放心使用,推动技术普及。

相关推荐
Loo国昌2 小时前
大型语言模型推理范式演进:从提示工程到思维算法
人工智能·算法·语言模型·自然语言处理
ToTensor2 小时前
国产GPU适配实战——五款二线主流AI加速卡深度评测
人工智能·显卡
古城小栈2 小时前
Go + 边缘计算:工业质检 AI 模型部署实践指南
人工智能·golang·边缘计算
SelectDB2 小时前
Apache Doris AI 能力揭秘(四):HSAP 一体化混合搜索架构全解
数据库·人工智能·agent
tap.AI2 小时前
AI时代的云安全(四)云环境中AI模型的安全生命周期管理实践
人工智能·安全
Codebee2 小时前
技术与业务双引擎驱动:Qoder与TRAE重塑强势软件新范式
人工智能
代码游侠2 小时前
学习笔记——线程控制 - 互斥与同步
linux·运维·笔记·学习·算法
骄傲的心别枯萎2 小时前
RV1126 NO.56:ROCKX+RV1126人脸识别推流项目之VI模块和VENC模块讲解
人工智能·opencv·计算机视觉·音视频·rv1126
汉得数字平台2 小时前
汉得H-AI飞码——前端编码助手V1.1.2正式发布:融业务知识,提开发效能
前端·人工智能·智能编码