三「模」联盟，谷歌 DeepMind 缔造终身学习智能体；清华“太极-Ⅱ”光芯片面世｜AGI 掘金资讯 8.8

酱酱们中午好～今天的 AGI 掘金热点资讯来啦，我们知识库上线了 AI 小助手，欢迎来撩！

🌟 技术突破

🔗 三「模」联盟，谷歌 DeepMind 缔造终身学习智能体！

谷歌 DeepMind 与帝国理工合作，开发了名为扩散增强智能体（DAAG）的框架，整合了大型语言模型、视觉语言模型和扩散模型，以实现具身 AI 的终身学习。DAAG 利用后见之明经验增强技术，自主协调迁移学习与高效探索，无需人类监督。实验证明，DAAG 在奖励检测器学习、经验迁移和新任务获取方面表现优异，为开发高效终身学习智能体提供了关键能力。该研究的论文已在 arXiv 上发表。

🔗 清华"太极-Ⅱ"光芯片面世：首创全前向智能光计算训练架构

清华大学电子工程系与自动化系联合研制的"太极-II"光训练芯片，采用全前向智能光计算训练架构，有效提升了光计算系统在大规模神经网络训练中的效率和精度。该成果已在《自然》期刊发表，标志着智能光计算领域的重要突破。太极-II 芯片通过两次前向传播实现梯度下降，无需电计算离线建模，大幅提高了训练速度和准确率。此外，该技术在复杂场景智能成像和拓扑光子学领域也展现出卓越性能，为光学计算系统的发展提供了新思路。

🔗 Meta 发布无需人工注释的自学评估器技术，超越 GPT-4 等大语言模型的审核效果

Meta 公司推出了创新的自学评估器技术，该技术通过合成数据训练 AI，减少对人工注释的依赖，有效提升自然语言处理技术的评估性能。MetaFAIR 团队在 Llama-3-70B-Instruct 模型上的应用测试显示，准确率显著提升至 88.7%，超越了使用人类注释训练的模型。这一进步预示着未来 NLP 评估将更依赖自动化和合成数据，有望降低成本并提高性能。

🔗 李飞飞「空间智能」之后，上交、智源、北大等提出空间大模型 SpatialBot

斯坦福大学研究生蔡闻骁与上海交通大学、北京智源人工智能研究院等机构合作，提出了空间大模型 SpatialBot，旨在提升多模态大模型在通用和具身场景下对空间和深度的理解。SpatialBot 通过 RGB-Depth 数据理解，能够准确获取物体深度，推动了空间智能的发展。研究者设计了 SpatialQA 数据集和 SpatialBench 测试榜单，通过不同层次的问题引导模型理解深度图。模型在空间位置关系、物体大小和接触判断等任务上展现了出色的性能，为具身智能领域提供了新的解决方案。

🔗 AI 编码无需人类插手！Claude 工程师摔断右手，竟一周狂肝 3000 行代码

工程师 Erik Schluntz 在右手受伤后，通过结合语音转文字技术和 Claude AI，实现了高效的编程工作。在两个月内，他与 AI 合作编写了 3000 行代码，体验到了未来编程的便利。Schluntz 通过具体指令和示例，优化了 AI 的代码生成能力，使其在迁移、重构代码等方面表现出色。他还构建了临时工具，提高了调试效率。这一实践预示着 AI 在软件开发中的潜力，未来可能将出现真正的"AI 工程师"，改变传统的编程方式。

🔗 AI 模型 Mirai 提前五年预警乳腺癌，MIT 研究登 Science 获 LeCun 转发

MIT CSAIL 实验室与 Jameel Clinic 联合开发的 AI 系统 Mirai，通过乳房 X 光检查预测乳腺癌风险，准确率超越传统模型。该系统采用时间点联合建模、非图像风险因素选择性使用和确保跨临床环境性能一致性三项创新，能适应不同临床环境并减少筛查伤害。Mirai 对不同种族女性均表现出高准确率，尤其在黑人女性中显示出降低死亡率的巨大潜力。目前，Mirai 正在进一步临床验证中，未来有望通过更精准的筛查策略，为乳腺癌早期诊断和治疗提供重要支持。

🔗 上海 AI Lab 搭台，36 个大模型一起角逐长上下文建模能力

上海 AI 实验室推出的 NeedleBench 评测框架对 36 个主流 AI 大模型进行了长文本处理能力的测试。结果显示，尽管在单一信息检索方面表现良好，但在复杂逻辑推理任务中，即使是顶级模型如 GPT-4 和 Claude-3-Opus 也面临挑战。特别在祖先追踪挑战中，随着上下文长度和复杂度增加，模型性能普遍下降。评测结果强调了模型优化策略的重要性，提示未来研究应超越参数量增加，注重模型结构和训练策略的改进。

🔗 无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成

北大和北京通用人工智能研究院联合推出了 LooGLE 基准数据集，旨在全面评估大型语言模型（LLMs）的长上下文理解能力。该数据集包含近 800 个超长文档，平均字数达 2 万，覆盖多个领域，设计有 5 种长期依赖任务，包括推理、计算、时间重排序等。评估结果显示，现有模型在处理长依赖任务时表现不佳，即使是商业模型平均准确率也仅为 40%，开源模型更低于 10%。LooGLE 为未来模型开发提供了重要的评估工具和改进方向。

💫 企业动态

🔗 应急管理"久安"大模型正式发布

中国应急管理部近日推出了"久安"AI 大模型，该模型集成了危险化学品、煤矿、森林火灾等业务领域的海量专业知识，通过国产大模型和应急云算力进行训练，能自动识别监控视频中的安全风险，辅助执法人员快速识别隐患，智能辅助应急处置，有效提升监测预警、监管执法和决策支持能力，为高质量发展和高水平安全提供科技支撑。

🔗 OpenAI 移动版 ChatGPT 七月报告：净收入 2800 万美元，新增 200 万付费用户

根据 Appfigures 报告，移动版 ChatGPT 应用 7 月在谷歌 Play Store 和苹果 App Store 的净收入为 2800 万美元。苹果 App Store 贡献了 83%的净收入，环比增长 20%。5 月至 7 月，应用总收入分别为 2890 万、3400 万和 3990 万美元。GPT-4o 技术提升了 ChatGPT 的文本、语音和视频处理能力，响应更快，交互更自然，推动了用户增长和收入提升。7 月份新增 200 万付费用户，刷新了应用记录。

🔗 Canva 可画推出"魔力工作室"AI 创作套件，让设计触手可及

全球在线视觉平台 Canva 可画在北京发布一站式 AI 创作套件"魔力工作室"，旨在通过 AI 技术简化设计流程，提升创意产出效率。用户仅需简单文字描述，即可快速生成多样化的图片、插画、文案和演示文稿。魔力工作室支持一键生成、编辑和转换，无需专业设计背景，适用于 99%的用户。Canva 可画进入中国市场六年，已助力用户创作超 5 亿个设计，与多家知名企业合作，赋能企业视觉管理和团队协作。未来将继续探索 AI 在设计领域的应用，提供更智能的创作体验。

🔗 腾讯元宝推出长文精读功能，提升专业阅读效率

腾讯元宝新增长文精读能力，支持用户上传专业文档进行深度阅读。依托腾讯混元大模型，该功能可处理近 50 万字输入，提供核心内容概览、模块化解析，并生成图表辅助理解。针对外文文献，能提炼创新点与不足，提取重点研究背景和结论，支持专业术语划词搜索或翻译。同时，对财务数据提供杜邦分析图等可视化工具，并集成计算器功能确保数值准确性。用户可离线查看精读内容及原文，腾讯元宝致力于提供一站式 AI 搜、读、写服务。

🔗 阿里推出 AI 数据科学家，全流程自动化，科研小白也能用

阿里巴巴基于 Modelscope-Agent 框架推出 DS Assistant，一款 AI 数据科学助手，能够自动化完成从 EDA 到模型评估的全流程。它通过接收任务描述，智能分解并调度子任务，执行并整合结果，显著提升复杂数据科学任务的效率。DS Assistant 支持代码自检和错误修正，能以 Jupyter Notebook 形式保存执行过程，已在 ML-Benchmark 上展示其性能优势，未来将优化任务执行成功率和支持批处理多文件场景。

🔗 月之暗面 Kimi 调整：上下文缓存存储费用直降 50%

月之暗面科技宣布，其 Kimi 开放平台的上下文缓存存储费用直降 50%，以降低开发者成本。上下文缓存技术通过预存频繁请求数据，显著减少系统对原始数据源的访问与计算需求，适用于多种 AI 应用场景。目前，该功能仅对 Tier5 等级用户开放，未来将逐步扩展至更多用户。公测期为 3 个月，期间价格可能根据市场反馈进行调整。

🔗 AI 威胁生计，美国游戏演员发起大罢工

美国演员工会（SAG-AFTRA）超过 16 万成员自 7 月 26 日起针对游戏行业发起罢工，抗议 AI 技术在未经授权的情况下使用演员形象和声音。工会要求对所有涉及声音和动作捕捉的演员进行保护，而游戏行业仅提议保护可识别部分的 AI 数字复制品。双方在保护范围上的分歧导致谈判破裂，尽管罢工并非全面停工，但对预算较低的独立游戏和 2023 年 8 月前已在制作的游戏影响有限。此次罢工是 SAG-AFTRA 自 2016 年以来第二次针对游戏行业的行动，焦点在于 AI 对演员职业的潜在威胁，结果可能对整个游戏行业产生重大影响。

🔗 Humane AI Pin 日销量不及退货量，公司陷入困境

Humane 公司推出的 AI Pin 因负面评价和高退货率陷入困境。自四月发布以来，退货数量已超过销量，目前仅剩约 7000 台设备在用户手中。产品被评价为"无法使用"和"最糟糕的产品"。公司正寻求稳定运营，同时面临惠普的潜在收购和债务筹集问题。尽管从硅谷知名人士处筹集了超过 2 亿美元资金，但销售额低迷，原计划第一年销售 10 万台的目标远未实现。公司高层出现人事变动，且在产品发布前已收到内部测试人员的负面反馈，但依然选择上市。

🎡 热门活动

🔗 AI Open Talk沙龙-第1期｜2024.8.8晚19：30｜线上直播

AGI 掘金成立于 2024 年7 月，是一家专注于 AGI 相关研究和应用的创新型知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展，并将其应用于各个行业，为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务，致力于成为行业的领军者。AGI 掘金期待你的加入！

欢迎戳我加入 AGI 掘金飞书社群交流学习😊