AI大模型日报#0923：李飞飞创业之后首个专访、华为云+腾讯音乐发布昇腾适配方案

导读：AI大模型日报，爬虫+LLM自动生成，一文览尽每日AI大模型要点资讯！

目前采用"文心一言"（ERNIE-4.0-8K-latest）、"智谱AI"（glm-4-0520）生成了今日要点以及每条资讯的摘要。欢迎阅读！

《AI大模型日报》今日要点：近日，AI大模型领域迎来多项重要进展。华为云与腾讯音乐天琴实验室达成深度合作，共同推出基于昇腾AI的视觉大模型推理加速方案，显著提升了推理速度与性价比，为大模型部署提供了高效经济的解决方案。美图公司则宣布其美图奇想大模型视频生成能力全面升级，生成效率与模型性能均实现进阶，优化了多领域风格泛化力。同时，李飞飞教授的空间智能创业公司World Labs正式亮相，她强调了空间智能在AI领域的重要性，并探讨了AI的终极目标。此外，上海AI Lab推出新一代视频生成大模型"书生・筑梦2.0"，支持长视频多格式生成及2K分辨率增强，并开源了训练框架LiteGen。在AI大模型的数学推理能力评测方面，北大与阿里巴巴联合打造的Omni-MATH评测基准显示，o1-mini模型表现最佳，验证了关注少部分能力、放弃广泛世界知识路线的优势。随着基础模型时代的来临，移动机器人的智能化也取得突破。研究者们期待将基础模型应用于移动机器人，提升其场景感知和任务执行能力，有望在未来展现更强的自主性和灵活性。这些进展共同推动了AI大模型领域的发展，为各行业数智化升级提供了有力支持。

标题: 华为云+腾讯音乐天琴实验室达成深度合作，基于昇腾AI

摘要: 9月19-21日，华为全联接大会在上海举办。腾讯音乐娱乐集团天琴实验室与华为云昇腾AI云服务合作，发布了视觉大模型推理加速方案lyraSD的昇腾适配方案。该方案采用多项优化策略，相比传统方案推理速度提升166%，性价比提升35%，降低了大模型部署门槛，提供了高效、经济的AI算力应用解决方案。此外，天琴实验室MUSELight将在昇腾AI算力的加速下，展开歌单封面生成业务试点，推进音乐制作产业数智化升级。双方还将推出更多大模型推理加速解决方案，全面赋能各项业务形态。
网址: 华为云+腾讯音乐天琴实验室达成深度合作，基于昇腾AI | 机器之心

标题: 美图奇想大模型全新升级：生成能力、生成效率、模型性能实现三重进阶

摘要: 9月23日，美图公司宣布美图奇想大模型（MiracleVision）视频生成能力全面升级，结合多项自研技术优势，显著提升视频生成时长、画质等。该模型支持长视频生成，并在艺术风格、细节把控上达到高度平衡，优化多领域风格泛化力。升级后的模型采用新技术路线，解决了视频生成核心问题，已应用于美图旗下部分产品，将提升用户体验与效率，并深化在多个领域的应用实践。
网址: 美图奇想大模型全新升级：生成能力、生成效率、模型性能实现三重进阶 | 机器之心

标题: 李飞飞创业之后首个专访：视觉空间智能与语言一样根本

摘要: 李飞飞教授的空间智能创业公司World Labs及其全明星团队正式亮相，随后她与联合创始人Justin Johnson接受了a16z的专访。在访谈中，李飞飞重点介绍了AI领域的新研究前沿------空间智能，认为其与语言一样根本。她回顾了自己在AI领域20多年的经历，以及ImageNet对计算机视觉发展的贡献，强调了计算和数据在AI发展中的重要作用。同时，她定义了AI的终极目标，并探讨了空间智能在其中所扮演的角色。最后，她介绍了World Labs团队及度量空间智能发展进展的方式。访谈还涉及了AI的发展历程、生成式AI与预测建模的区别等话题。
网址: 李飞飞创业之后首个专访：视觉空间智能与语言一样根本 | 机器之心

标题: 开源！上海AI Lab视频生成大模型书生·筑梦 2.0来了
摘要: 机器之心AIxiv专栏促进了全球学术交流，现推出上海人工智能实验室的新一代视频生成大模型"书生・筑梦2.0"，支持长视频、多格式生成和2K分辨率增强。该模型采用扩散式Transformer架构，并开源训练框架LiteGen，优化显存和序列长度，提升视频生成效率。团队由上海人工智能实验室和新加坡南洋理工大学S-Lab成员组成，致力于视频生成技术的前沿研究，包括VBench、VideoBooth等多个项目进展。
网址: 开源！上海AI Lab视频生成大模型书生·筑梦 2.0来了 | 机器之心

标题: 北大AI奥数评测，o1-mini比o1-preview分数还高

摘要: 北大与阿里巴巴的研究团队联合打造了一个数学奥林匹克评测基准------Omni-MATH，用于评估大型语言模型在奥林匹克水平的数学推理能力。该评测集包含4428道竞赛级别的问题，涵盖33个子领域和10个难度级别。在最新排行榜中，o1-mini表现最佳，平均分比o1-preview高8%，验证了关注少部分能力、放弃广泛世界知识路线的优势。此外，Omni-MATH具有人工验证答案的可靠性、清晰合理的难度分类和广泛的题目类型等特点。研究团队对国内外奥林匹克数学竞赛进行了调研，构建了树状分类体系，并利用GPT-4o给每道题目分类。同时，还开发了一个开源的答案验证器Omni-Judge，用于验证模型的输出是否和标准答案一致，评测一致率高达95%。
网址: 北大AI奥数评测，o1-mini比o1-preview分数还高 | 量子位

标题: 秋分 | 基础模型时代下的移动机器人
摘要: 1966年，斯坦福大学SRI研究所开发的Shakey是第一个具备感知、规划和执行能力的自主移动机器人，但受限于当时的技术和计算能力，其应用有限。随着硬件、计算和算法的发展，移动机器人已走向实际应用。研究者期待将基础模型应用于移动机器人，提升场景感知和任务执行能力。一种稳健的研究思路是扩展基于地图的技术路线，利用先进传感器和SLAM算法构建高质量地图，结合基础模型进行场景理解和任务执行。同时，探索将信息与大语言模型结合，处理更复杂指令任务。另一种新颖做法是端到端移动机器人算法，直接通过大模型处理传感器数据并执行动作，避免繁琐规则设计，但面临数据挑战。尽管存在诸多问题，基础模型的结合仍为移动机器人带来智能化突破，有望在未来展现更强自主性和灵活性。
网址: 秋分 | 基础模型时代下的移动机器人 - 智源社区