三「模」联盟,谷歌 DeepMind 缔造终身学习智能体;清华“太极-Ⅱ”光芯片面世|AGI 掘金资讯 8.8

酱酱们中午好~今天的 AGI 掘金热点资讯来啦,我们知识库上线了 AI 小助手,欢迎来撩

🌟 技术突破

🔗 三「模」联盟,谷歌 DeepMind 缔造终身学习智能体!

谷歌 DeepMind 与帝国理工合作,开发了名为扩散增强智能体(DAAG)的框架,整合了大型语言模型、视觉语言模型和扩散模型,以实现具身 AI 的终身学习。DAAG 利用后见之明经验增强技术,自主协调迁移学习与高效探索,无需人类监督。实验证明,DAAG 在奖励检测器学习、经验迁移和新任务获取方面表现优异,为开发高效终身学习智能体提供了关键能力。该研究的论文已在 arXiv 上发表。

🔗 清华"太极-Ⅱ"光芯片面世:首创全前向智能光计算训练架构

清华大学电子工程系与自动化系联合研制的"太极-II"光训练芯片,采用全前向智能光计算训练架构,有效提升了光计算系统在大规模神经网络训练中的效率和精度。该成果已在《自然》期刊发表,标志着智能光计算领域的重要突破。太极-II 芯片通过两次前向传播实现梯度下降,无需电计算离线建模,大幅提高了训练速度和准确率。此外,该技术在复杂场景智能成像和拓扑光子学领域也展现出卓越性能,为光学计算系统的发展提供了新思路。

🔗 Meta 发布无需人工注释的自学评估器技术,超越 GPT-4 等大语言模型的审核效果

Meta 公司推出了创新的自学评估器技术,该技术通过合成数据训练 AI,减少对人工注释的依赖,有效提升自然语言处理技术的评估性能。MetaFAIR 团队在 Llama-3-70B-Instruct 模型上的应用测试显示,准确率显著提升至 88.7%,超越了使用人类注释训练的模型。这一进步预示着未来 NLP 评估将更依赖自动化和合成数据,有望降低成本并提高性能。

🔗 李飞飞「空间智能」之后,上交、智源、北大等提出空间大模型 SpatialBot

斯坦福大学研究生蔡闻骁与上海交通大学、北京智源人工智能研究院等机构合作,提出了空间大模型 SpatialBot,旨在提升多模态大模型在通用和具身场景下对空间和深度的理解。SpatialBot 通过 RGB-Depth 数据理解,能够准确获取物体深度,推动了空间智能的发展。研究者设计了 SpatialQA 数据集和 SpatialBench 测试榜单,通过不同层次的问题引导模型理解深度图。模型在空间位置关系、物体大小和接触判断等任务上展现了出色的性能,为具身智能领域提供了新的解决方案。

🔗 AI 编码无需人类插手!Claude 工程师摔断右手,竟一周狂肝 3000 行代码

工程师 Erik Schluntz 在右手受伤后,通过结合语音转文字技术和 Claude AI,实现了高效的编程工作。在两个月内,他与 AI 合作编写了 3000 行代码,体验到了未来编程的便利。Schluntz 通过具体指令和示例,优化了 AI 的代码生成能力,使其在迁移、重构代码等方面表现出色。他还构建了临时工具,提高了调试效率。这一实践预示着 AI 在软件开发中的潜力,未来可能将出现真正的"AI 工程师",改变传统的编程方式。

🔗 AI 模型 Mirai 提前五年预警乳腺癌,MIT 研究登 Science 获 LeCun 转发

MIT CSAIL 实验室与 Jameel Clinic 联合开发的 AI 系统 Mirai,通过乳房 X 光检查预测乳腺癌风险,准确率超越传统模型。该系统采用时间点联合建模、非图像风险因素选择性使用和确保跨临床环境性能一致性三项创新,能适应不同临床环境并减少筛查伤害。Mirai 对不同种族女性均表现出高准确率,尤其在黑人女性中显示出降低死亡率的巨大潜力。目前,Mirai 正在进一步临床验证中,未来有望通过更精准的筛查策略,为乳腺癌早期诊断和治疗提供重要支持。

🔗 上海 AI Lab 搭台,36 个大模型一起角逐长上下文建模能力

上海 AI 实验室推出的 NeedleBench 评测框架对 36 个主流 AI 大模型进行了长文本处理能力的测试。结果显示,尽管在单一信息检索方面表现良好,但在复杂逻辑推理任务中,即使是顶级模型如 GPT-4 和 Claude-3-Opus 也面临挑战。特别在祖先追踪挑战中,随着上下文长度和复杂度增加,模型性能普遍下降。评测结果强调了模型优化策略的重要性,提示未来研究应超越参数量增加,注重模型结构和训练策略的改进。

🔗 无一大模型及格! 北大/通研院提出超难基准,专门评估长文本理解生成

北大和北京通用人工智能研究院联合推出了 LooGLE 基准数据集,旨在全面评估大型语言模型(LLMs)的长上下文理解能力。该数据集包含近 800 个超长文档,平均字数达 2 万,覆盖多个领域,设计有 5 种长期依赖任务,包括推理、计算、时间重排序等。评估结果显示,现有模型在处理长依赖任务时表现不佳,即使是商业模型平均准确率也仅为 40%,开源模型更低于 10%。LooGLE 为未来模型开发提供了重要的评估工具和改进方向。

💫 企业动态

🔗 应急管理"久安"大模型正式发布

中国应急管理部近日推出了"久安"AI 大模型,该模型集成了危险化学品、煤矿、森林火灾等业务领域的海量专业知识,通过国产大模型和应急云算力进行训练,能自动识别监控视频中的安全风险,辅助执法人员快速识别隐患,智能辅助应急处置,有效提升监测预警、监管执法和决策支持能力,为高质量发展和高水平安全提供科技支撑。

🔗 OpenAI 移动版 ChatGPT 七月报告:净收入 2800 万美元,新增 200 万付费用户

根据 Appfigures 报告,移动版 ChatGPT 应用 7 月在谷歌 Play Store 和苹果 App Store 的净收入为 2800 万美元。苹果 App Store 贡献了 83%的净收入,环比增长 20%。5 月至 7 月,应用总收入分别为 2890 万、3400 万和 3990 万美元。GPT-4o 技术提升了 ChatGPT 的文本、语音和视频处理能力,响应更快,交互更自然,推动了用户增长和收入提升。7 月份新增 200 万付费用户,刷新了应用记录。

🔗 Canva 可画推出"魔力工作室"AI 创作套件,让设计触手可及

全球在线视觉平台 Canva 可画在北京发布一站式 AI 创作套件"魔力工作室",旨在通过 AI 技术简化设计流程,提升创意产出效率。用户仅需简单文字描述,即可快速生成多样化的图片、插画、文案和演示文稿。魔力工作室支持一键生成、编辑和转换,无需专业设计背景,适用于 99%的用户。Canva 可画进入中国市场六年,已助力用户创作超 5 亿个设计,与多家知名企业合作,赋能企业视觉管理和团队协作。未来将继续探索 AI 在设计领域的应用,提供更智能的创作体验。

🔗 腾讯元宝推出长文精读功能,提升专业阅读效率

腾讯元宝新增长文精读能力,支持用户上传专业文档进行深度阅读。依托腾讯混元大模型,该功能可处理近 50 万字输入,提供核心内容概览、模块化解析,并生成图表辅助理解。针对外文文献,能提炼创新点与不足,提取重点研究背景和结论,支持专业术语划词搜索或翻译。同时,对财务数据提供杜邦分析图等可视化工具,并集成计算器功能确保数值准确性。用户可离线查看精读内容及原文,腾讯元宝致力于提供一站式 AI 搜、读、写服务。

🔗 阿里推出 AI 数据科学家,全流程自动化,科研小白也能用

阿里巴巴基于 Modelscope-Agent 框架推出 DS Assistant,一款 AI 数据科学助手,能够自动化完成从 EDA 到模型评估的全流程。它通过接收任务描述,智能分解并调度子任务,执行并整合结果,显著提升复杂数据科学任务的效率。DS Assistant 支持代码自检和错误修正,能以 Jupyter Notebook 形式保存执行过程,已在 ML-Benchmark 上展示其性能优势,未来将优化任务执行成功率和支持批处理多文件场景。

🔗 月之暗面 Kimi 调整:上下文缓存存储费用直降 50%

月之暗面科技宣布,其 Kimi 开放平台的上下文缓存存储费用直降 50%,以降低开发者成本。上下文缓存技术通过预存频繁请求数据,显著减少系统对原始数据源的访问与计算需求,适用于多种 AI 应用场景。目前,该功能仅对 Tier5 等级用户开放,未来将逐步扩展至更多用户。公测期为 3 个月,期间价格可能根据市场反馈进行调整。

🔗 AI 威胁生计,美国游戏演员发起大罢工

美国演员工会(SAG-AFTRA)超过 16 万成员自 7 月 26 日起针对游戏行业发起罢工,抗议 AI 技术在未经授权的情况下使用演员形象和声音。工会要求对所有涉及声音和动作捕捉的演员进行保护,而游戏行业仅提议保护可识别部分的 AI 数字复制品。双方在保护范围上的分歧导致谈判破裂,尽管罢工并非全面停工,但对预算较低的独立游戏和 2023 年 8 月前已在制作的游戏影响有限。此次罢工是 SAG-AFTRA 自 2016 年以来第二次针对游戏行业的行动,焦点在于 AI 对演员职业的潜在威胁,结果可能对整个游戏行业产生重大影响。

🔗 Humane AI Pin 日销量不及退货量,公司陷入困境

Humane 公司推出的 AI Pin 因负面评价和高退货率陷入困境。自四月发布以来,退货数量已超过销量,目前仅剩约 7000 台设备在用户手中。产品被评价为"无法使用"和"最糟糕的产品"。公司正寻求稳定运营,同时面临惠普的潜在收购和债务筹集问题。尽管从硅谷知名人士处筹集了超过 2 亿美元资金,但销售额低迷,原计划第一年销售 10 万台的目标远未实现。公司高层出现人事变动,且在产品发布前已收到内部测试人员的负面反馈,但依然选择上市。

✨ 行业观点

🔗 "AI 教母"李飞飞:加州 AI 安全法案将损害美国 AI 生态系统

斯坦福教授李飞飞在《Fortune》撰文,警告加州即将实施的 AI 安全法案 SB-1047 可能对 AI 开发者、学术界和整个美国 AI 生态系统造成伤害,同时无法有效解决 AI 潜在危害。法案要求 AI 模型证明无害,对违规使用模型的公司处罚严厉,还要求开发者提交客户资料并承担连带责任。李飞飞认为,该法案将过度惩罚开发者、束缚开源开发、削弱公共部门和学术界 AI 研究,且未能解决 AI 发展中的偏见和深度伪造问题。她呼吁制定促进创新、减轻限制影响的 AI 政策。

🔗 欧洲版 OpenAI CEO:开源模型没有任何风险,我只看到了好处

Mistral AI 的 CEO Arthur Mensch 在接受《时代》杂志专访时强调,开源 AI 模型是中立的工具,具有巨大潜力而无风险。他认为 AI 技术类似于更抽象的编程语言,将在未来十年内改变工作方式。Mistral AI 致力于通过开源模型和高效的技术,提供定制化服务,同时与微软等公司合作,确保独立性和多样性。Mensch 还讨论了欧洲 AI 生态系统的发展,强调了建立本土前沿模型的重要性,并认为开源是确保技术安全和创新的关键。

🔗 巴黎奥运会利用 AI 数据中心废热为游泳池加热

2024 年巴黎奥运会采用创新环保措施,使用 Equinix PA10 数据中心的废热为游泳池加热。该技术将冷却系统产生的热废气转化为热水,不仅为赛事提供温暖环境,还为超过 1000 户家庭提供能源,预计每年减少 1800 吨二氧化碳排放。项目获得 200 万欧元投资,承诺 15 年内免费提供热能。尽管存在对数据中心资源消耗的批评,这一实践被视为对循环经济和数据中心环保潜力的探索。

🎡 热门活动

🔗 AI Open Talk沙龙-第1期|2024.8.8晚19:30|线上直播

AGI 掘金成立于 2024 年7 月,是一家专注于 AGI 相关研究和应用的创新型 知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展,并将其应用于各个行业,为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务,致力于成为行业的领军者。AGI 掘金期待你的加入!

欢迎戳我加入 AGI 掘金飞书社群交流学习😊

相关推荐
AI前沿技术追踪11 分钟前
OpenAI 12天发布会:AI革命的里程碑@附35页PDF文件下载
人工智能
余~~1853816280017 分钟前
稳定的碰一碰发视频、碰一碰矩阵源码技术开发,支持OEM
开发语言·人工智能·python·音视频
galileo20161 小时前
LLM与金融
人工智能
DREAM依旧1 小时前
隐马尔科夫模型|前向算法|Viterbi 算法
人工智能
GocNeverGiveUp1 小时前
机器学习2-NumPy
人工智能·机器学习·numpy
B站计算机毕业设计超人2 小时前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
学术头条2 小时前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
18号房客2 小时前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
feifeikon2 小时前
机器学习DAY3 : 线性回归与最小二乘法与sklearn实现 (线性回归完)
人工智能·机器学习·线性回归
游客5202 小时前
opencv中的常用的100个API
图像处理·人工智能·python·opencv·计算机视觉