苹果首次发布开源语言模型
近期,苹果在 Hugging Face 发布了 OpenELM 系列模型。OpenELM 的关键创新是逐层扩展策略,该策略可在 transformer 模型的每一层中有效地分配参数,从而提高准确性。
与具有统一参数分配的传统语言模型不同,OpenELM 可以改变转换器层的配置,调整每层 的注意力头和前馈网络乘法器的数量。
苹果称,OpenELM 模型的发布,旨在通过提供对最先进的语言模型的访问,来增强和丰富开放研究社区。
华为盘古大模型 5.0 将在 HDC 2024 亮相
华为终端昨日官宣,华为开发者大会(HDC 2024)将于 6 月 21 日- 23 日在东莞松山举办,此次发布会,盘古大模型 5.0 与 HarmonyOs NEXT 鸿蒙星河版将同台亮相。
此前,余承东曾表示,鸿蒙生态原生应用开发持续加速,目前已有 4000 多个头部应用拥抱鸿蒙生态。HarmonyOs NEXT 鸿蒙星河版也与各个领域的开发者和合作伙伴,携手为消费者带来全场景的极致体验。
英伟达将收购 Run:ai
英伟达在官网宣布,将收购 GPU 编排软件提供商 Run:ai 。英伟达称,此举目的是为了帮助客户更有效地利用其 AI 计算资源。
无论是在本地、云端还是混合环境中,Run:ai 的软件可以使企业能够更好地管理和优化其基于 GPU 的计算基础设施。英伟达计划继续在相同的商业模式下提供 Run:ai 的产品,并投资 Run:ai 产品路线图,作为 NVIDIA DGX Cloud 平台的一部分。
此次收购,加强了英伟达在为企业和研究人员提供全面的 GPU 管理解决方案方面的地位,简化了在不同环境中使用 GPU 的过程。