酱酱们中午好,给大家带来 AGI 掘金 的今日热点资讯啦,欢迎阅读交流哦!
🌟 技术突破
🔗 AI 训 AI 惨遭投毒 9 次大崩溃
牛津、剑桥等机构研究发现,使用 AI 生成的数据训练 AI 模型会导致模型崩溃,即模型逐渐丢失对数据分布尾部的感知,最终输出质量下降。实验显示,多代 AI 模型在自身生成数据上训练后,输出变得胡言乱语,甚至出现错误。研究建议,为避免模型崩溃,应使用更多人类生成的真实数据,并可能需要开发更鲁棒的训练算法。
🔗 AI 大模型再次集体失智,傻傻数不清 r
近期,多个 AI 大模型在回答简单问题如"Strawberry"中有几个"r"时出现失误,引发广泛关注。尽管一些模型如 Llama-3.1 能自我纠正,但其他如 Claude 3.5 Sonnet 却越改越错。全球网友尝试各种方法教导 AI,包括使用 Few-Shot CoT 和特定提示词技巧。有模型如谷歌 Gemini 能较高概率答对,而国内模型如字节豆包、智谱清言的 ChatGLM 等也展现了稳定的正确回答能力。问题根源在于大模型对单个字符的理解有限,而通过代码调用等方法可有效解决。业界期待大模型公司在后续版本中改进此问题。
🔗 减轻幻觉新 SOTA,自迭代训练框架 ANAH-v2,7B 模型超越 GPT-4
上海 AI lab 设计的 ANAH-v2 框架通过迭代自训练,有效提升了幻觉检测能力。该框架利用期望最大化算法,不断优化标注工具,扩大数据集规模。7B 参数的幻觉标注模型在 HaluEval 和 HalluQA 基准测试中取得新的最佳性能,准确率超越 GPT-4。ANAH-v2 不仅为幻觉评估提供基准,还展示了在幻觉缓解方面的潜力,通过重新排序策略显著降低幻觉水平。
🔗 我国团队开发国际首个糖尿病诊疗多模态大模型 DeepDR-LLM
上海交通大学医学院附属第六人民医院与清华大学等团队合作,开发出全球首个糖尿病诊疗多模态大模型 DeepDR-LLM。该系统结合大语言模型和深度学习技术,提供糖尿病视网膜病变辅助诊断及个性化管理意见。研究成果已在 Nature Medicine 发表,验证了其在多中心队列中的有效性,为全球糖尿病治理提供数字解决方案。
🔗 谷歌 AI 拿下 IMO 银牌,仅差一分得金!第四题仅用时 19 秒
谷歌 DeepMind 的数学 AI 在 2024 年国际数学奥林匹克竞赛中获得银牌,仅差一分即可夺冠。AI 解决了 6 道题目中的 4 道,满分 28 分,接近金牌线。AlphaProof 和 AlphaGeometry 2 是 Alpha 家族的新成员,分别负责证明数学陈述和解决几何问题。AlphaGeometry 2 在解决第四题时仅用 19 秒,展现了其强大的计算能力。此次成绩得到专业认证,显示了 AI 在数学领域的先进水平。
🔗 OpenAI 推出基于规则的奖励机制 RBR 提升 AI 安全性
OpenAI 为提高 AI 系统的安全性和与人类价值观的一致性,开发了一种新的奖励机制------基于规则的奖励(RBR)。RBR 通过定义一组命题和规则,自动执行模型微调,适应变化的安全政策,减少对人类数据的依赖。RBR 结合了固定语言模型的评估,拟合线性模型,与 PPO 算法结合,鼓励模型安全行为。实验表明,RBR 训练的模型在安全性能上与人类反馈训练的模型相当,同时减少了过度拒绝安全请求的情况,提高了训练效率和成本效益。此外,RBR 有助于快速更新安全准则,减少人工监督的需求,但仍需考虑潜在的偏见问题。
🔗 Open-Sora Plan v1.2 发布,清晰度、推理速度起飞
Open-Sora Plan v1.2 版本引入 3D 全注意力架构,极大提升了 AI 对物理世界的理解能力。新版本不仅增强了文本生成视频的能力,还通过优化 VAE 结构,显著提升了视频的清晰度和内容连贯性。同时,新架构完美融合了空间与时间维度,大幅提高了视频生成的空间表现力和时间流畅度。此外,推理速度的显著提升,让模型性能和效率得到飞跃。Open-Sora 团队的开源精神,将推动 AI 视频生成技术快速发展。
💫 企业动态
🔗 OpenAI 正式进军搜索!发布 SearchGPT:专挑谷歌不会的问题演示
OpenAI 推出 SearchGPT 原型,专注于解决与具体时空相关的问题,提供对话式答案和图片、链接等辅助信息。相较于谷歌等传统搜索引擎,SearchGPT 在时效性和个性化方面表现出色。目前处于收集反馈阶段,未来有望集成到 ChatGPT 中。用户可通过特定链接排队试用,体验这一创新搜索服务。
🔗 微软大动作:Bing 推出了基于 AI 的生成式搜索功能
微软 Bing 搜索引擎新增 AI 生成式搜索功能,标志着搜索技术的重大进步。AI 搜索引擎通过自然语言处理和生成模型,理解用户查询并以对话形式提供直接答案,极大提升了搜索效率。此举可能对传统搜索引擎霸主 Google 构成挑战。同时,其他 AI 搜索引擎如 Perplexity、秘塔 AI 搜索和 360AI 搜索也在市场中崭露头角,预示着搜索行业的未来趋势。
🔗 Reddit 被曝屏蔽多个搜索引擎和 AI 爬虫,官方称与谷歌合作无关
Reddit 近期更新了其 robots.txt 文件,全面禁止搜索引擎和 AI 爬虫抓取其网站内容。此举被认为与谷歌合作无关,Reddit 表示是因为抓取内容的商业实体增多并存在滥用情况。尽管 Bing、DuckDuckGo 等搜索引擎一度受到影响,但最新测试显示它们已重新显示 Reddit 的搜索内容。Reddit 发言人强调,与谷歌的合作不涉及此变动,且公司正在与多个搜索引擎讨论,但未能与所有搜索引擎就内容使用和 AI 训练达成协议。
🔗 百川智能回应 200 亿元估值:为 B 轮投前估值,A 轮总融资额达 50 亿元
百川智能近期宣布完成 A 轮融资,总金额 50 亿元人民币,以 200 亿元估值启动 B 轮融资。A 轮融资吸引了包括阿里、小米、腾讯等头部企业和多家国资背景投资基金。百川智能致力于医疗领域的 AI 应用,已发布 12 款大模型,包括最新推出的第四代基座大模型 Baichuan 4 和 AI 助手应用"百小应"。公司坚持"超级模型+超级应用"战略,医疗领域被视为超级应用的最佳场景。
🔗 AgentGPT 团队新作,四个人用 AI Agent 爬取整个公开网络,获投数百万美元
Reworkd 团队通过其 AgentGPT 工具在 GitHub 上爆红后���专注于利用 AI Agent 从公共网络中提取结构化数据。公司已从 YC、AI Grant 等投资者处筹集了 400 万美元资金。Reworkd 的 AI Agent 能够自动化抓取多个网站的数据,减少人工干预,提高效率。其技术优势在于能够处理大量小网站的数据抓取,避免传统网络抓取工具的高成本和复杂性。
🔗 小鹏汽车将于 7 月 30 日举行 AI 智驾技术发布会
根据小鹏汽车官方 7 月 25 日发布的消息,小鹏汽车将于 7 月 30 日 19:30 召开 AI 智能驾驶技术发布会。届时,小鹏 XNGP 系统将迎来其历史上最大的一次升级,同时小鹏 AI 天玑 XOS 5.2.0 版本也将展示出新的技术突破。
🔗 微软宣布与 Lumen Technologies 合作,扩展 AI 数据中心网络
微软为满足日益增长的 AI 服务需求,宣布与网络系统提供商 Lumen Technologies 建立合作伙伴关系。Lumen 将通过其 Private Connectivity Fabric 为微软提供专用光纤网络,增强数据中心间的连接能力,以支持 AI 基础设施的网络容量、性能、稳定性和速度。此次合作预计将为 Lumen 带来超过 2000 万美元的现金流增长。Lumen Technologies 自 1930 年成立以来,经历了多次变革,曾使用不同名称,直至 2020 年更名。
🔗 提前曝光 Llama 3.1,Meta 为什么想做「大模型界 Linux」?
Meta 公司开源了其大型参数模型 Llama 3.1,拥有 4050 亿个参数,旨在成为开源 AI 领域的行业标准。Llama 3.1 在多项基准测试中表现优异,尽管目前不支持多模态能力,但 Meta 正致力于添加图像、视频和语音识别功能。尽管模型开源,但运行和推理成本高昂,可能限制了其广泛应用。Meta 希望通过开源策略,建立开放的 AI 生态系统,推动 Llama 成为行业标准,同时鼓励开发者利用 Llama 进行微调和蒸馏,创建定制化的小模型。扎克伯格预测,Meta AI 将在未来几个月内使用量超过 ChatGPT,并成为最广泛使用的 AI 助手。
✨ 行业观点
🔗 彭博社公布 2024 最值得关注的 16 家 AI 初创公司,OpenAI 上榜
彭博社公布了 2024 年人工智能新锐企业排行榜,涵盖了 10 家规模最大、资金最充足的 AI 初创公司和 6 家重要后起之秀。其中,OpenAI 以 860 亿美元估值领先,Anthropic 和马斯克的 xAI 紧随其后。中国 AI 初创企业 01.AI(零一万物)由李开复创立,凭借其千亿参数模型 Yi-Large,获得 10 亿美元估值,成为榜单上唯一中国企业,显示了中美在 AI 领域的激烈竞争态势。
🔗 AI 生产力罗生门:96%老板力推 77%员工认为增加工作量
最新报告显示,96%的企业领导者认为 AI 能提高生产力,但 77%的员工觉得 AI 增加了工作量,47%的员工不知道如何提升生产力。85%的公司使用 AI,其中 39%强制使用。自由职业者对 AI 的熟练度和使用频率较高,但全职员工在满足生产率要求方面面临更多挑战。
🔗 腾讯、清华等多位生物大模型作者专访,畅谈 AI 生物学,解析大型细胞模型技术
多位顶尖科学家讨论了大型细胞模型(LCM)在生物学研究中的应用潜力。LCM 如 scBERT、Geneformer、scGPT 等展示了在单细胞转录组学等领域的巨大潜力,通过预训练和迁移学习,这些模型在细胞类型注释、基因网络预测等方面表现出色。专家还探讨了模型开发中的技术挑战和未来发展方向,强调了 AI 在推动生物学研究中的关键作用。
🔗 Perplexity CEO 谈 AI 搜索:做知识发现引擎,不是搜索引擎
Perplexity CEO Aravind Srinivas 在播客中讨论了 AI 搜索的未来,强调其目标是成为知识发现引擎而非传统搜索引擎,旨在通过更智能的方式帮助用户发现新知识和信息。
🔗 红杉美国合伙人:分发革命接近极限,下一次是计算革命!
红杉资本合伙人 Pat Grady 在 Cerebral Valley New York 大会上分享了对人工智能领域的洞见。他认为,当前 AI 模型已具备颠覆行业的能力,重点在于模型上的工程工作,如认知架构和推理。AI 将主要赋能服务行业,而非简单复制现有软件。Grady 预测,AI 将推动数万亿美元新业务的崛起,并强调模型稳定性对满足客户需求的重要性。他还指出,基础模型公司可能类似于数据库公司,而 OpenAI 则可能成为面向消费者的业务。
AGI 掘金成立于 2024 年7 月,是一家专注于 AGI 相关研究和应用的创新型 知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展,并将其应用于各个行业,为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务,致力于成为行业的领军者。AGI 掘金期待你的加入!