AI大模型日报#0923:李飞飞创业之后首个专访、华为云+腾讯音乐发布昇腾适配方案

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用"文心一言"(ERNIE-4.0-8K-latest)、"智谱AI"(glm-4-0520)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:近日,AI大模型领域迎来多项重要进展。华为云与腾讯音乐天琴实验室达成深度合作,共同推出基于昇腾AI的视觉大模型推理加速方案,显著提升了推理速度与性价比,为大模型部署提供了高效经济的解决方案。美图公司则宣布其美图奇想大模型视频生成能力全面升级,生成效率与模型性能均实现进阶,优化了多领域风格泛化力。同时,李飞飞教授的空间智能创业公司World Labs正式亮相,她强调了空间智能在AI领域的重要性,并探讨了AI的终极目标。 此外,上海AI Lab推出新一代视频生成大模型"书生・筑梦2.0",支持长视频多格式生成及2K分辨率增强,并开源了训练框架LiteGen。在AI大模型的数学推理能力评测方面,北大与阿里巴巴联合打造的Omni-MATH评测基准显示,o1-mini模型表现最佳,验证了关注少部分能力、放弃广泛世界知识路线的优势。 随着基础模型时代的来临,移动机器人的智能化也取得突破。研究者们期待将基础模型应用于移动机器人,提升其场景感知和任务执行能力,有望在未来展现更强的自主性和灵活性。这些进展共同推动了AI大模型领域的发展,为各行业数智化升级提供了有力支持。

标题: 华为云+腾讯音乐天琴实验室达成深度合作,基于昇腾AI

摘要: 9月19-21日,华为全联接大会在上海举办。腾讯音乐娱乐集团天琴实验室与华为云昇腾AI云服务合作,发布了视觉大模型推理加速方案lyraSD的昇腾适配方案。该方案采用多项优化策略,相比传统方案推理速度提升166%,性价比提升35%,降低了大模型部署门槛,提供了高效、经济的AI算力应用解决方案。此外,天琴实验室MUSELight将在昇腾AI算力的加速下,展开歌单封面生成业务试点,推进音乐制作产业数智化升级。双方还将推出更多大模型推理加速解决方案,全面赋能各项业务形态。
网址: 华为云+腾讯音乐天琴实验室达成深度合作,基于昇腾AI | 机器之心

标题: 美图奇想大模型全新升级:生成能力、生成效率、模型性能实现三重进阶

摘要: 9月23日,美图公司宣布美图奇想大模型(MiracleVision)视频生成能力全面升级,结合多项自研技术优势,显著提升视频生成时长、画质等。该模型支持长视频生成,并在艺术风格、细节把控上达到高度平衡,优化多领域风格泛化力。升级后的模型采用新技术路线,解决了视频生成核心问题,已应用于美图旗下部分产品,将提升用户体验与效率,并深化在多个领域的应用实践。
网址: 美图奇想大模型全新升级:生成能力、生成效率、模型性能实现三重进阶 | 机器之心

标题: 李飞飞创业之后首个专访:视觉空间智能与语言一样根本

摘要: 李飞飞教授的空间智能创业公司World Labs及其全明星团队正式亮相,随后她与联合创始人Justin Johnson接受了a16z的专访。在访谈中,李飞飞重点介绍了AI领域的新研究前沿------空间智能,认为其与语言一样根本。她回顾了自己在AI领域20多年的经历,以及ImageNet对计算机视觉发展的贡献,强调了计算和数据在AI发展中的重要作用。同时,她定义了AI的终极目标,并探讨了空间智能在其中所扮演的角色。最后,她介绍了World Labs团队及度量空间智能发展进展的方式。访谈还涉及了AI的发展历程、生成式AI与预测建模的区别等话题。
网址: 李飞飞创业之后首个专访:视觉空间智能与语言一样根本 | 机器之心

标题: 开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了
摘要: 机器之心AIxiv专栏促进了全球学术交流,现推出上海人工智能实验室的新一代视频生成大模型"书生・筑梦2.0",支持长视频、多格式生成和2K分辨率增强。该模型采用扩散式Transformer架构,并开源训练框架LiteGen,优化显存和序列长度,提升视频生成效率。团队由上海人工智能实验室和新加坡南洋理工大学S-Lab成员组成,致力于视频生成技术的前沿研究,包括VBench、VideoBooth等多个项目进展。
网址: 开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了 | 机器之心

标题: 北大AI奥数评测,o1-mini比o1-preview分数还高

摘要: 北大与阿里巴巴的研究团队联合打造了一个数学奥林匹克评测基准------Omni-MATH,用于评估大型语言模型在奥林匹克水平的数学推理能力。该评测集包含4428道竞赛级别的问题,涵盖33个子领域和10个难度级别。在最新排行榜中,o1-mini表现最佳,平均分比o1-preview高8%,验证了关注少部分能力、放弃广泛世界知识路线的优势。此外,Omni-MATH具有人工验证答案的可靠性、清晰合理的难度分类和广泛的题目类型等特点。研究团队对国内外奥林匹克数学竞赛进行了调研,构建了树状分类体系,并利用GPT-4o给每道题目分类。同时,还开发了一个开源的答案验证器Omni-Judge,用于验证模型的输出是否和标准答案一致,评测一致率高达95%。
网址: 北大AI奥数评测,o1-mini比o1-preview分数还高 | 量子位

标题: 秋分 | 基础模型时代下的移动机器人
摘要: 1966年,斯坦福大学SRI研究所开发的Shakey是第一个具备感知、规划和执行能力的自主移动机器人,但受限于当时的技术和计算能力,其应用有限。随着硬件、计算和算法的发展,移动机器人已走向实际应用。研究者期待将基础模型应用于移动机器人,提升场景感知和任务执行能力。一种稳健的研究思路是扩展基于地图的技术路线,利用先进传感器和SLAM算法构建高质量地图,结合基础模型进行场景理解和任务执行。同时,探索将信息与大语言模型结合,处理更复杂指令任务。另一种新颖做法是端到端移动机器人算法,直接通过大模型处理传感器数据并执行动作,避免繁琐规则设计,但面临数据挑战。尽管存在诸多问题,基础模型的结合仍为移动机器人带来智能化突破,有望在未来展现更强自主性和灵活性。
网址: 秋分 | 基础模型时代下的移动机器人 - 智源社区

相关推荐
weixin79893765432...17 分钟前
React + Fastify + DeepSeek 实现一个简单的对话式 AI 应用
人工智能·react.js·fastify
大千AI助手31 分钟前
概率单位回归(Probit Regression)详解
人工智能·机器学习·数据挖掘·回归·大千ai助手·概率单位回归·probit回归
狂炫冰美式1 小时前
3天,1人,从0到付费产品:AI时代个人开发者的生存指南
前端·人工智能·后端
LCG元2 小时前
垂直Agent才是未来:详解让大模型"专业对口"的三大核心技术
人工智能
我不是QI2 小时前
周志华《机器学习—西瓜书》二
人工智能·安全·机器学习
操练起来2 小时前
【昇腾CANN训练营·第八期】Ascend C生态兼容:基于PyTorch Adapter的自定义算子注册与自动微分实现
人工智能·pytorch·acl·昇腾·cann
KG_LLM图谱增强大模型2 小时前
[500页电子书]构建自主AI Agent系统的蓝图:谷歌重磅发布智能体设计模式指南
人工智能·大模型·知识图谱·智能体·知识图谱增强大模型·agenticai
声网2 小时前
活动推荐丨「实时互动 × 对话式 AI」主题有奖征文
大数据·人工智能·实时互动
caiyueloveclamp2 小时前
【功能介绍03】ChatPPT好不好用?如何用?用户操作手册来啦!——【AI溯源篇】
人工智能·信息可视化·powerpoint·ai生成ppt·aippt
q***48413 小时前
Vanna AI:告别代码,用自然语言轻松查询数据库,领先的RAG2SQL技术让结果更智能、更精准!
人工智能·microsoft