美国将限制中国,使用Azure、AWS等云,训练AI大模型

1月29日,美国商务部在Federal Register(联邦公报)正式公布了,《采取额外措施应对与重大恶意网络行为相关的国家紧急状态》提案。

该提案明确要求美国IaaS(云服务)厂商在提供云服务时,要验证外国用户身份,限制外国行为者对美国IaaS产品的访问,并要求详细报告训练AI大模型的外国交易,以保护美国的网络安全和利益。

美国商务部长Raimondo在接受路透社采访时说:"我们不能让非国家行为者、中国或者美国不希望那些使用我们云服务人,来训练他们的AI大模型。"

联邦公报发布的消息

该提案将对微软的Azure、亚马逊的AWS、谷歌的Alphabet等美国云服务商产生重大影响。同时为国内的讯飞星火、文心一言等大模型带来商业契机。

针对该提案,路透社采访Raimondo

该提案一共38页,「AIGC开放社区」为大家介绍D部分,基础云服务商,有验证客户身份的责任、特殊措施以及使用其产品进行AI大模型训练的详细主要内容。

目的和AI模型定义

1)要求美国 IaaS提供商实施相关计划,保存与外国人拥有权益的 IaaS 帐户相关的某些记录,并核实这些人的身份。

同时要求其外国分销商也这样做,以方便执法部门要求提供这些记录,并以其他方式执行第13984号行政命令和第 14110 号行政命令的规定。

2)**AI大模型主要包含两大类:**基础大模型,基于广泛数据训练的AI模型,一般采用自我监督包含至少数百亿参数;

生成式AI,能模拟输入数据的结构和特征,从而生成全新的内容,包括文本、图像、视频、音频和其他数字内容。

客户识别计划

1)一般情况下,每个美国 IaaS 提供商必须维护和实施符合要求的书面客户识别计划 (CIP)。

2)CIP范围,CIP必须适合 IaaS 提供商的规模、所提供 IaaS 产品的类型和相关风险(包括 IaaS 提供商提供的各种服务类型、开立账户的各种方法、可用识别信息的不同类型以及 IaaS 提供商的客户群所带来的风险)。

任何 IaaS 提供商如果只是美国 IaaS 产品的转售商,则可通过与初始美国 IaaS 提供商达成协议,参考、使用或采用初始美国 IaaS 提供商的 CIP 以满足限制要求。

3)身份验证,CIP 必须包括基于风险的程序,用于验证每个外国客户的身份,使美国 IaaS 提供商或美国 IaaS 产品的外国转售商,能够合理地相信自己知道每个客户的真实身份。

4)客户信息要求,CIP要求美国IaaS提供商和销售美国IaaS产品的外国转售商,必须通过适当程序核实潜在客户及其实际所有者是否为美国人。

如果确认客户和所有受益人都是美国人,那么这个规定就不适用于为这些美国客户开设的IaaS账户。如果非美国人,这些提供商和转售商需要进行合理的尽职调查,以验证那些客户的真实身份

5)CIP 必须包含开立账户的程序,具体说明将从每个潜在客户和账户受益所有人处获得的识别信息,以确定他们是否为美国人。这些程序必须为美国 IaaS 提供商或美国 IaaS 产品的外国转售商提供可靠的依据,以核实其客户和实际所有人的真实身份,并反映合理的尽职调查努力。

AI大模型训练审核报告

如果一个大模型符合《联邦公报》公布的解释性规则中规定的要求,则该模型应被视为具有可用于恶意网络活动潜在能力的,AI大模型。以下是需要进行审核的案例展示。

1)外国公司 A 提议在美国 IaaS 提供商 B 公司的计算基础设施上训练一个AI大模型,并与 B 公司签订了训练所提议模型的协议。

A 公司寻求训练的模型的技术规格符合大型AI模型的技术条件,该模型具有可用于恶意网络活动的潜在能力。则需要报告详细的训练过程。

2)A 公司(美国人)对 B 公司(外国人)进行股权投资,其中一部分投资以使用 A 公司计算基础设施的信用额度的形式进行。

A 公司有理由相信,B 公司打算使用这些信用额度来训练一个大型AI模型,该模型具有可用于恶意网络活动的潜在能力。

3)A 公司(美国人)同意为 B 公司(外国人)训练一个AI模型。一开始,商定的模型技术规格不符合双重用途基础模型或令人担忧的模型的技术条件。

然而,在培训开始后,培训程序的调整或对模型能力的新认识使A公司有理由相信,该模型实际上将具备大型AI模型的技术条件,其潜在能力可用于恶意网络活动。

4)A 公司(美国人)同意为 B 公司(外国人)在 C 公司拥有的设施内的计算基础设施上训练一个AI模型。并具备AI大模型的技术条件,有可能被用于恶意网络活动的潜在能力。

要想了解全部提案内容,可以在联邦公报官网查看。

本文素材来源联邦公报官网,如有侵权请联系删除

相关推荐
engchina8 分钟前
CUTLASS:高性能 CUDA 线性代数模板库详解
人工智能·线性代数·cuda·cutlass
带我去滑雪22 分钟前
基于三种机器学习方法的磁芯损耗预测模型
人工智能·机器学习
猫头不能躺36 分钟前
【pytorch】卷积神经网络
人工智能·pytorch·cnn
无水先生1 小时前
集成技术综合指南:Bagging 和 Boosting
人工智能·算法·机器学习
浮生如梦_1 小时前
C#Halcon图像处理畸变校正之曲面校正
图像处理·人工智能·算法·c#·视觉检测
leo03081 小时前
目标检测,语义分割标注工具--labelimg labelme
人工智能·目标检测·计算机视觉
tilblackout1 小时前
机器学习详解(11):分类任务的模型评估标准
人工智能·机器学习·分类
阿正的梦工坊2 小时前
Pytorch详解 train() 和 eval() 模式会影响Layer Norm吗?(中英双语)
人工智能·pytorch·python
qq_273900232 小时前
pytorch 张量的unfold方法介绍
人工智能·pytorch·python
lyw_YTU_Sussex2 小时前
深度学习day6|用pytorch实现VGG-16模型人脸识别
人工智能·pytorch·深度学习