美国将限制中国,使用Azure、AWS等云,训练AI大模型

1月29日,美国商务部在Federal Register(联邦公报)正式公布了,《采取额外措施应对与重大恶意网络行为相关的国家紧急状态》提案。

该提案明确要求美国IaaS(云服务)厂商在提供云服务时,要验证外国用户身份,限制外国行为者对美国IaaS产品的访问,并要求详细报告训练AI大模型的外国交易,以保护美国的网络安全和利益。

美国商务部长Raimondo在接受路透社采访时说:"我们不能让非国家行为者、中国或者美国不希望那些使用我们云服务人,来训练他们的AI大模型。"

联邦公报发布的消息

该提案将对微软的Azure、亚马逊的AWS、谷歌的Alphabet等美国云服务商产生重大影响。同时为国内的讯飞星火、文心一言等大模型带来商业契机。

针对该提案,路透社采访Raimondo

该提案一共38页,「AIGC开放社区」为大家介绍D部分,基础云服务商,有验证客户身份的责任、特殊措施以及使用其产品进行AI大模型训练的详细主要内容。

目的和AI模型定义

1)要求美国 IaaS提供商实施相关计划,保存与外国人拥有权益的 IaaS 帐户相关的某些记录,并核实这些人的身份。

同时要求其外国分销商也这样做,以方便执法部门要求提供这些记录,并以其他方式执行第13984号行政命令和第 14110 号行政命令的规定。

2)**AI大模型主要包含两大类:**基础大模型,基于广泛数据训练的AI模型,一般采用自我监督包含至少数百亿参数;

生成式AI,能模拟输入数据的结构和特征,从而生成全新的内容,包括文本、图像、视频、音频和其他数字内容。

客户识别计划

1)一般情况下,每个美国 IaaS 提供商必须维护和实施符合要求的书面客户识别计划 (CIP)。

2)CIP范围,CIP必须适合 IaaS 提供商的规模、所提供 IaaS 产品的类型和相关风险(包括 IaaS 提供商提供的各种服务类型、开立账户的各种方法、可用识别信息的不同类型以及 IaaS 提供商的客户群所带来的风险)。

任何 IaaS 提供商如果只是美国 IaaS 产品的转售商,则可通过与初始美国 IaaS 提供商达成协议,参考、使用或采用初始美国 IaaS 提供商的 CIP 以满足限制要求。

3)身份验证,CIP 必须包括基于风险的程序,用于验证每个外国客户的身份,使美国 IaaS 提供商或美国 IaaS 产品的外国转售商,能够合理地相信自己知道每个客户的真实身份。

4)客户信息要求,CIP要求美国IaaS提供商和销售美国IaaS产品的外国转售商,必须通过适当程序核实潜在客户及其实际所有者是否为美国人。

如果确认客户和所有受益人都是美国人,那么这个规定就不适用于为这些美国客户开设的IaaS账户。如果非美国人,这些提供商和转售商需要进行合理的尽职调查,以验证那些客户的真实身份

5)CIP 必须包含开立账户的程序,具体说明将从每个潜在客户和账户受益所有人处获得的识别信息,以确定他们是否为美国人。这些程序必须为美国 IaaS 提供商或美国 IaaS 产品的外国转售商提供可靠的依据,以核实其客户和实际所有人的真实身份,并反映合理的尽职调查努力。

AI大模型训练审核报告

如果一个大模型符合《联邦公报》公布的解释性规则中规定的要求,则该模型应被视为具有可用于恶意网络活动潜在能力的,AI大模型。以下是需要进行审核的案例展示。

1)外国公司 A 提议在美国 IaaS 提供商 B 公司的计算基础设施上训练一个AI大模型,并与 B 公司签订了训练所提议模型的协议。

A 公司寻求训练的模型的技术规格符合大型AI模型的技术条件,该模型具有可用于恶意网络活动的潜在能力。则需要报告详细的训练过程。

2)A 公司(美国人)对 B 公司(外国人)进行股权投资,其中一部分投资以使用 A 公司计算基础设施的信用额度的形式进行。

A 公司有理由相信,B 公司打算使用这些信用额度来训练一个大型AI模型,该模型具有可用于恶意网络活动的潜在能力。

3)A 公司(美国人)同意为 B 公司(外国人)训练一个AI模型。一开始,商定的模型技术规格不符合双重用途基础模型或令人担忧的模型的技术条件。

然而,在培训开始后,培训程序的调整或对模型能力的新认识使A公司有理由相信,该模型实际上将具备大型AI模型的技术条件,其潜在能力可用于恶意网络活动。

4)A 公司(美国人)同意为 B 公司(外国人)在 C 公司拥有的设施内的计算基础设施上训练一个AI模型。并具备AI大模型的技术条件,有可能被用于恶意网络活动的潜在能力。

要想了解全部提案内容,可以在联邦公报官网查看。

本文素材来源联邦公报官网,如有侵权请联系删除

相关推荐
金井PRATHAMA2 小时前
描述逻辑(Description Logic)对自然语言处理深层语义分析的影响与启示
人工智能·自然语言处理·知识图谱
Rock_yzh2 小时前
AI学习日记——参数的初始化
人工智能·python·深度学习·学习·机器学习
CiLerLinux4 小时前
第四十九章 ESP32S3 WiFi 路由实验
网络·人工智能·单片机·嵌入式硬件
七芒星20235 小时前
多目标识别YOLO :YOLOV3 原理
图像处理·人工智能·yolo·计算机视觉·目标跟踪·分类·聚类
Learn Beyond Limits6 小时前
Mean Normalization|均值归一化
人工智能·神经网络·算法·机器学习·均值算法·ai·吴恩达
ACERT3336 小时前
5.吴恩达机器学习—神经网络的基本使用
人工智能·python·神经网络·机器学习
C嘎嘎嵌入式开发6 小时前
(一) 机器学习之深度神经网络
人工智能·神经网络·dnn
Aaplloo6 小时前
【无标题】
人工智能·算法·机器学习
大模型任我行6 小时前
复旦:LLM隐式推理SIM-CoT
人工智能·语言模型·自然语言处理·论文笔记
tomlone7 小时前
AI大模型核心概念
人工智能