OpenAI 正式进军搜索！发布 SearchGPT：专挑谷歌不会的问题演示｜AGI 掘金资讯 7.26

🌟 技术突破

🔗 AI 训 AI 惨遭投毒 9 次大崩溃

牛津、剑桥等机构研究发现，使用 AI 生成的数据训练 AI 模型会导致模型崩溃，即模型逐渐丢失对数据分布尾部的感知，最终输出质量下降。实验显示，多代 AI 模型在自身生成数据上训练后，输出变得胡言乱语，甚至出现错误。研究建议，为避免模型崩溃，应使用更多人类生成的真实数据，并可能需要开发更鲁棒的训练算法。

近期，多个 AI 大模型在回答简单问题如"Strawberry"中有几个"r"时出现失误，引发广泛关注。尽管一些模型如 Llama-3.1 能自我纠正，但其他如 Claude 3.5 Sonnet 却越改越错。全球网友尝试各种方法教导 AI，包括使用 Few-Shot CoT 和特定提示词技巧。有模型如谷歌 Gemini 能较高概率答对，而国内模型如字节豆包、智谱清言的 ChatGLM 等也展现了稳定的正确回答能力。问题根源在于大模型对单个字符的理解有限，而通过代码调用等方法可有效解决。业界期待大模型公司在后续版本中改进此问题。

🔗 减轻幻觉新 SOTA，自迭代训练框架 ANAH-v2，7B 模型超越 GPT-4

上海 AI lab 设计的 ANAH-v2 框架通过迭代自训练，有效提升了幻觉检测能力。该框架利用期望最大化算法，不断优化标注工具，扩大数据集规模。7B 参数的幻觉标注模型在 HaluEval 和 HalluQA 基准测试中取得新的最佳性能，准确率超越 GPT-4。ANAH-v2 不仅为幻觉评估提供基准，还展示了在幻觉缓解方面的潜力，通过重新排序策略显著降低幻觉水平。

🔗 我国团队开发国际首个糖尿病诊疗多模态大模型 DeepDR-LLM

上海交通大学医学院附属第六人民医院与清华大学等团队合作，开发出全球首个糖尿病诊疗多模态大模型 DeepDR-LLM。该系统结合大语言模型和深度学习技术，提供糖尿病视网膜病变辅助诊断及个性化管理意见。研究成果已在 Nature Medicine 发表，验证了其在多中心队列中的有效性，为全球糖尿病治理提供数字解决方案。

🔗 谷歌 AI 拿下 IMO 银牌，仅差一分得金！第四题仅用时 19 秒

谷歌 DeepMind 的数学 AI 在 2024 年国际数学奥林匹克竞赛中获得银牌，仅差一分即可夺冠。AI 解决了 6 道题目中的 4 道，满分 28 分，接近金牌线。AlphaProof 和 AlphaGeometry 2 是 Alpha 家族的新成员，分别负责证明数学陈述和解决几何问题。AlphaGeometry 2 在解决第四题时仅用 19 秒，展现了其强大的计算能力。此次成绩得到专业认证，显示了 AI 在数学领域的先进水平。

🔗 OpenAI 推出基于规则的奖励机制 RBR 提升 AI 安全性

OpenAI 为提高 AI 系统的安全性和与人类价值观的一致性，开发了一种新的奖励机制------基于规则的奖励（RBR）。RBR 通过定义一组命题和规则，自动执行模型微调，适应变化的安全政策，减少对人类数据的依赖。RBR 结合了固定语言模型的评估，拟合线性模型，与 PPO 算法结合，鼓励模型安全行为。实验表明，RBR 训练的模型在安全性能上与人类反馈训练的模型相当，同时减少了过度拒绝安全请求的情况，提高了训练效率和成本效益。此外，RBR 有助于快速更新安全准则，减少人工监督的需求，但仍需考虑潜在的偏见问题。

🔗 Open-Sora Plan v1.2 发布，清晰度、推理速度起飞

Open-Sora Plan v1.2 版本引入 3D 全注意力架构，极大提升了 AI 对物理世界的理解能力。新版本不仅增强了文本生成视频的能力，还通过优化 VAE 结构，显著提升了视频的清晰度和内容连贯性。同时，新架构完美融合了空间与时间维度，大幅提高了视频生成的空间表现力和时间流畅度。此外，推理速度的显著提升，让模型性能和效率得到飞跃。Open-Sora 团队的开源精神，将推动 AI 视频生成技术快速发展。

💫 企业动态

🔗 OpenAI 正式进军搜索！发布 SearchGPT：专挑谷歌不会的问题演示

OpenAI 推出 SearchGPT 原型，专注于解决与具体时空相关的问题，提供对话式答案和图片、链接等辅助信息。相较于谷歌等传统搜索引擎，SearchGPT 在时效性和个性化方面表现出色。目前处于收集反馈阶段，未来有望集成到 ChatGPT 中。用户可通过特定链接排队试用，体验这一创新搜索服务。

🔗 微软大动作：Bing 推出了基于 AI 的生成式搜索功能

微软 Bing 搜索引擎新增 AI 生成式搜索功能，标志着搜索技术的重大进步。AI 搜索引擎通过自然语言处理和生成模型，理解用户查询并以对话形式提供直接答案，极大提升了搜索效率。此举可能对传统搜索引擎霸主 Google 构成挑战。同时，其他 AI 搜索引擎如 Perplexity、秘塔 AI 搜索和 360AI 搜索也在市场中崭露头角，预示着搜索行业的未来趋势。

🔗 Reddit 被曝屏蔽多个搜索引擎和 AI 爬虫，官方称与谷歌合作无关

Reddit 近期更新了其 robots.txt 文件，全面禁止搜索引擎和 AI 爬虫抓取其网站内容。此举被认为与谷歌合作无关，Reddit 表示是因为抓取内容的商业实体增多并存在滥用情况。尽管 Bing、DuckDuckGo 等搜索引擎一度受到影响，但最新测试显示它们已重新显示 Reddit 的搜索内容。Reddit 发言人强调，与谷歌的合作不涉及此变动，且公司正在与多个搜索引擎讨论，但未能与所有搜索引擎就内容使用和 AI 训练达成协议。

🔗 百川智能回应 200 亿元估值：为 B 轮投前估值，A 轮总融资额达 50 亿元

百川智能近期宣布完成 A 轮融资，总金额 50 亿元人民币，以 200 亿元估值启动 B 轮融资。A 轮融资吸引了包括阿里、小米、腾讯等头部企业和多家国资背景投资基金。百川智能致力于医疗领域的 AI 应用，已发布 12 款大模型，包括最新推出的第四代基座大模型 Baichuan 4 和 AI 助手应用"百小应"。公司坚持"超级模型+超级应用"战略，医疗领域被视为超级应用的最佳场景。

🔗 AgentGPT 团队新作，四个人用 AI Agent 爬取整个公开网络，获投数百万美元

Reworkd 团队通过其 AgentGPT 工具在 GitHub 上爆红后��专注于利用 AI Agent 从公共网络中提取结构化数据。公司已从 YC、AI Grant 等投资者处筹集了 400 万美元资金。Reworkd 的 AI Agent 能够自动化抓取多个网站的数据，减少人工干预，提高效率。其技术优势在于能够处理大量小网站的数据抓取，避免传统网络抓取工具的高成本和复杂性。

🔗 小鹏汽车将于 7 月 30 日举行 AI 智驾技术发布会

根据小鹏汽车官方 7 月 25 日发布的消息，小鹏汽车将于 7 月 30 日 19:30 召开 AI 智能驾驶技术发布会。届时，小鹏 XNGP 系统将迎来其历史上最大的一次升级，同时小鹏 AI 天玑 XOS 5.2.0 版本也将展示出新的技术突破。

🔗 微软宣布与 Lumen Technologies 合作，扩展 AI 数据中心网络

微软为满足日益增长的 AI 服务需求，宣布与网络系统提供商 Lumen Technologies 建立合作伙伴关系。Lumen 将通过其 Private Connectivity Fabric 为微软提供专用光纤网络，增强数据中心间的连接能力，以支持 AI 基础设施的网络容量、性能、稳定性和速度。此次合作预计将为 Lumen 带来超过 2000 万美元的现金流增长。Lumen Technologies 自 1930 年成立以来，经历了多次变革，曾使用不同名称，直至 2020 年更名。

🔗 提前曝光 Llama 3.1，Meta 为什么想做「大模型界 Linux」？

Meta 公司开源了其大型参数模型 Llama 3.1，拥有 4050 亿个参数，旨在成为开源 AI 领域的行业标准。Llama 3.1 在多项基准测试中表现优异，尽管目前不支持多模态能力，但 Meta 正致力于添加图像、视频和语音识别功能。尽管模型开源，但运行和推理成本高昂，可能限制了其广泛应用。Meta 希望通过开源策略，建立开放的 AI 生态系统，推动 Llama 成为行业标准，同时鼓励开发者利用 Llama 进行微调和蒸馏，创建定制化的小模型。扎克伯格预测，Meta AI 将在未来几个月内使用量超过 ChatGPT，并成为最广泛使用的 AI 助手。

AGI 掘金成立于 2024 年7 月，是一家专注于 AGI 相关研究和应用的创新型知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展，并将其应用于各个行业，为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务，致力于成为行业的领军者。AGI 掘金期待你的加入！

欢迎戳我加入 AGI 掘金飞书社群交流学习😊