趋动科技陈飞:从小模型到大模型,AI时代下的数据中心建设

自AI大模型横空出世,不断推动着AI从学术界到产业界向大众破圈,新的时代正在来临。11月15-16日,由CDCC主办的"2023第11届数据中心标准大会"在北京国家会议中心盛大开幕。

本届大会的主题围绕"AI时代 重塑未来",聚焦数据中心领域科技前沿,行业各领域专家从算力演进、智能升级、液冷落地、能源革新四个层面,分享了数据中心产业向AI智算时代迈进的前沿趋势、创新路径和实践经验,展示了行业高质量发展的布局与成果。

趋动科技联合创始人兼CTO陈飞博士受邀参加《智算未来·驱动AI绿色算力》论坛,并发表题为《从小模型到大模型,AI时代下的数据中心建设》的演讲,深入探讨了大模型时代,在数据中心建设中对AI算力的需求和挑战。

趋动科技联合创始人兼CTO陈飞博士

算力建设对于数据中心和人工智能发展具有重要意义,它不仅支持大模型的训练和推理,还为各行各业提供了强大的计算能力。在医疗领域,算力建设可以加速医学影像的分析和疾病诊断;在金融领域,可以进行高频交易和风险评估等复杂计算任务。此外,数据中心的算力建设还有助于推动科学研究的进展,如天文学、气候学和基因组学等领域。

然而,算力建设也面临着一些挑战。大模型通常包含数以亿计的参数,需要在海量数据上训练以获得准确的结果。为了满足这种需求,数据中心必须能够提供足够的算力和存储能力。这首先带来了成本问题,高性能硬件和大规模存储系统的采购和维护成本较高。其次是能源消耗和热管理问题,大规模数据中心需要消耗大量的电力,并且需要有效地处理散发的热量。此外,数据中心的安全性和可靠性也是需要重视的问题,因为它们存储和处理着大量敏感数据。

AI算力资源池化技术为数据中心提供了从软件角度实现智能分配计算资源、提高算力利用率的思路。

算力池化解决方案架构图

OrionX AI算力资源池化解决方案,通过软件定义算力、共享GPU的理念来构建GPU资源池,让企业内的AI用户共享数据中心内所有服务器上的AI算力,提升资源利用率5-8倍。

面对国内AI芯片的迅速崛起,趋动科技在技术方面积极创新,OrionX 现在已经能兼容包括海光、寒武纪等在内的国产芯片,实现异构资源池化管理。资源池内各类硬件加速卡可通过趋动科技 OrionX进行算力抽象,软件化后形成统一的AI算力资源提供给上层应用使用。异构算力池化解决方案可在实现多厂商AI算力硬件统一管理、统一调度、统一使用的同时,结合软件定义异构算力技术实现AI算力的统筹分配、资源池化、高效保障和运维管理。

实现异构算力的统一调度及管理

凭借标准化、可复制的产品架构,趋动科技得到了包括运营商、互联网、金融、自动驾驶、制造业、能源、科研机构和高校等大量行业头部客户的认可和规模化落地,帮助他们提升了资源利用率和工作人效,保护已有投资。

算力是推动人工智能技术发展的重要因素。随着技术的不断进步,我们可以期待算力建设在推动人工智能创新和解决现实问题方面发挥更大的作用。

相关推荐
shuououo1 小时前
YOLOv4 核心内容笔记
人工智能·计算机视觉·目标跟踪
菜鸡儿齐4 小时前
spark组件-spark core(批处理)-rdd创建
大数据·分布式·spark
DO_Community5 小时前
普通服务器都能跑:深入了解 Qwen3-Next-80B-A3B-Instruct
人工智能·开源·llm·大语言模型·qwen
WWZZ20255 小时前
快速上手大模型:机器学习3(多元线性回归及梯度、向量化、正规方程)
人工智能·算法·机器学习·机器人·slam·具身感知
deephub5 小时前
深入BERT内核:用数学解密掩码语言模型的工作原理
人工智能·深度学习·语言模型·bert·transformer
PKNLP5 小时前
BERT系列模型
人工智能·深度学习·bert
weixin_177297220696 小时前
家政小程序系统开发:打造便捷高效的家政服务平台
大数据·小程序·家政
兰亭妙微6 小时前
ui设计公司审美积累 | 金融人工智能与用户体验 用户界面仪表盘设计
人工智能·金融·ux
AKAMAI7 小时前
安全风暴的绝地反击 :从告警地狱到智能防护
运维·人工智能·云计算
岁月宁静7 小时前
深度定制:在 Vue 3.5 应用中集成流式 AI 写作助手的实践
前端·vue.js·人工智能