亚马逊云科技通过生成式AI,帮助清华RIOS加速计算和分析的处理效率

近日,硬件创建平台Efabless宣布了其第一届"生成式AI开源芯片设计挑战赛"(AI Generated Open-Source Silicon Design Challenge)的评选结果。来自清华大学的RISC-V国际开源实验室(RIOS Lab)团队基于亚马逊云科技云上科研计算平台的支持,凭借参赛项目"CyberRio"的基于RISC-V的CPU设计荣获亚军,在全球范围内首先实现了由生成式AI(Generative AI)作为第一贡献者实现CPU设计并以全开源方式成功流片(tape-out)。

本次评选是由Efabless组织的,面向全球的软硬件设计工程师、爱好者和研究人员的国际性比赛,旨在激发人工智能和机器学习在IC制造领域的创新力量,推动开源硬件社区和人工智能的协同发展。参赛者需要使用生成式AI为数字设计生成完整的Verilog模型。

RIOS团队成员王心泽、尹国华、朱奕霏成功地基于亚马逊云科技云上科研计算平台的支持并基于大语言模型,设计了面向处理器应用场景的设计流程,用该流程生成可综合HDL(硬件描述语言),完成了五级流水架构,支持RV32I非特权ISA和机器模式的CPU设计,并通过了基本的仿真和验证,最后基于130nm工艺成功流片。这标志着全球第一个由大语言模型(LLM)完成主要设计的CPU被实际制造,为LLM在IC设计领域的应用开启了新可能。

来自RIOS Lab的感言及

亚马逊云科技的创新支持计划

来自RIOS实验室的亚马逊创新支持项目负责人王翕博士表示:"非常感谢亚马逊云科技助力AI算力和创新支持计划,为我们这个项目发挥了关键的作用,提供了强大的计算能力和丰富的工具支持。这些服务的使用,使得团队能够在短时间内完成复杂的计算任务,从而实现了这一重要的技术突破,依托此平台,最终顺利完成流片,获得了相关比赛亚军,同近期备受关注的纽约大学一起成为该领域的首批探索者。我们在此表达对亚马逊云科技的感谢,相信今后的合作会带来更多的创新和突破。"

亚马逊云科技基于云计算的自服务式开源平台的科研云上工作台(Service Workbench),帮助RIOS研究人员实现了协作研究的可视化。研究人员通过访问用户界面即可快速找到并获取和使用感兴趣的机器学习分析数据。Service Workbench目前提供了三种类型的数据集(Studies):个人数据集、组织数据集和公共数据集,便于研究人员同组织中其他成员共享和协同。配合本项目中使用到的配备了DDR5内存的最新一代内存优化型高性能实例R7g,帮助RIOS加速了计算和分析的处理效率。该实例采用定制的基于ARM架构的Graviton 3处理器,相对于上一代Graviton 2处理器内存带宽,计算性能以及浮点性能分别提升了50%,25%和200%。机器学习推理性能更是提升了3倍,已被广泛应用于包括开放源数据库、内存缓存和实时大数据分析等场景在内的内存密集型工作负载中。

王翕博士提到的创新支持计划,是亚马逊云科技一项旨在加强与高校和科研机构在技术创新上的合作与交流计划,包括:

1)支持构建云端科研、研发环境,包括科研软件、研发软件的云端部署和任务执行;

2)执行概念验证、基准测试、性能测试,评估将研究工作负载或公共数据集迁移至云中的效能提升;

3)通过研讨会或培训,培养更广泛社区对云的研究工作负载。

关于亚马逊云科技的芯片行业

方案及高性能计算(HPC)

作为全球领先的云服务提供商及半导体行业领导者,亚马逊云科技不仅自身持续开发并批量生产了多款高端制程芯片,同时也提供安全、敏捷且可扩展的平台,包含全面服务集成的解决方案以实现高性能设计、验证和智能制造。

面向半导体芯片设计领域Chiplet的兴起,AI/ML技术提升IC设计效率以及云上高性能算力的三大趋势,亚马逊云科技基于自身多款高性能芯片设计经验以及全球众多领先芯片设计公司作为客户的最佳实践,持续发布并更新适用于电子设计自动化(EDA)的高性能计算(HPC)方案实现最佳匹配。包括适用于EDA设计的高弹性自动集成计算解决方案(SOCA),帮助客户一站式解决从UI用户界面、云端集群预处理和后处理的可视化、实时分析、自定义代码和自动化能力等半导体芯片设计类客户痛点。

借助近乎无限的计算容量、高性能文件系统和高吞吐量网络,更快地获得洞察力,并快速将创意和产品推向市场。基于相关亚马逊云科技方案及合作伙伴方案,成功帮助联发科(MediaTek)、安谋科技(ARM)、恩智浦(NXP)、高通(Qualcomm)等客户完成了相关云上设计工作负载。

相关推荐
清 晨9 分钟前
Web3 生态全景:创新与发展之路
人工智能·web3·去中心化·智能合约
公众号Codewar原创作者30 分钟前
R数据分析:工具变量回归的做法和解释,实例解析
开发语言·人工智能·python
lucy1530275107934 分钟前
MCU 功耗基准测试
科技·单片机·嵌入式硬件·智能家居·信号处理·工控主板
IT古董1 小时前
【漫话机器学习系列】020.正则化强度的倒数C(Inverse of regularization strength)
人工智能·机器学习
进击的小小学生1 小时前
机器学习连载
人工智能·机器学习
Trouvaille ~1 小时前
【机器学习】从流动到恒常,无穷中归一:积分的数学诗意
人工智能·python·机器学习·ai·数据分析·matplotlib·微积分
dundunmm1 小时前
论文阅读:Deep Fusion Clustering Network With Reliable Structure Preservation
论文阅读·人工智能·数据挖掘·聚类·深度聚类·图聚类
szxinmai主板定制专家1 小时前
【国产NI替代】基于FPGA的4通道电压 250M采样终端边缘计算采集板卡,主控支持龙芯/飞腾
人工智能·边缘计算
是十一月末1 小时前
Opencv实现图像的腐蚀、膨胀及开、闭运算
人工智能·python·opencv·计算机视觉
云空1 小时前
《探索PyTorch计算机视觉:原理、应用与实践》
人工智能·pytorch·python·深度学习·计算机视觉