OpenAI 正式进军搜索!发布 SearchGPT:专挑谷歌不会的问题演示|AGI 掘金资讯 7.26

酱酱们中午好,给大家带来 AGI 掘金 的今日热点资讯啦,欢迎阅读交流哦!

🌟 技术突破

🔗 AI 训 AI 惨遭投毒 9 次大崩溃

牛津、剑桥等机构研究发现,使用 AI 生成的数据训练 AI 模型会导致模型崩溃,即模型逐渐丢失对数据分布尾部的感知,最终输出质量下降。实验显示,多代 AI 模型在自身生成数据上训练后,输出变得胡言乱语,甚至出现错误。研究建议,为避免模型崩溃,应使用更多人类生成的真实数据,并可能需要开发更鲁棒的训练算法。

🔗 AI 大模型再次集体失智,傻傻数不清 r

近期,多个 AI 大模型在回答简单问题如"Strawberry"中有几个"r"时出现失误,引发广泛关注。尽管一些模型如 Llama-3.1 能自我纠正,但其他如 Claude 3.5 Sonnet 却越改越错。全球网友尝试各种方法教导 AI,包括使用 Few-Shot CoT 和特定提示词技巧。有模型如谷歌 Gemini 能较高概率答对,而国内模型如字节豆包、智谱清言的 ChatGLM 等也展现了稳定的正确回答能力。问题根源在于大模型对单个字符的理解有限,而通过代码调用等方法可有效解决。业界期待大模型公司在后续版本中改进此问题。

🔗 减轻幻觉新 SOTA,自迭代训练框架 ANAH-v2,7B 模型超越 GPT-4

上海 AI lab 设计的 ANAH-v2 框架通过迭代自训练,有效提升了幻觉检测能力。该框架利用期望最大化算法,不断优化标注工具,扩大数据集规模。7B 参数的幻觉标注模型在 HaluEval 和 HalluQA 基准测试中取得新的最佳性能,准确率超越 GPT-4。ANAH-v2 不仅为幻觉评估提供基准,还展示了在幻觉缓解方面的潜力,通过重新排序策略显著降低幻觉水平。

🔗 我国团队开发国际首个糖尿病诊疗多模态大模型 DeepDR-LLM

上海交通大学医学院附属第六人民医院与清华大学等团队合作,开发出全球首个糖尿病诊疗多模态大模型 DeepDR-LLM。该系统结合大语言模型和深度学习技术,提供糖尿病视网膜病变辅助诊断及个性化管理意见。研究成果已在 Nature Medicine 发表,验证了其在多中心队列中的有效性,为全球糖尿病治理提供数字解决方案。

🔗 谷歌 AI 拿下 IMO 银牌,仅差一分得金!第四题仅用时 19 秒

谷歌 DeepMind 的数学 AI 在 2024 年国际数学奥林匹克竞赛中获得银牌,仅差一分即可夺冠。AI 解决了 6 道题目中的 4 道,满分 28 分,接近金牌线。AlphaProof 和 AlphaGeometry 2 是 Alpha 家族的新成员,分别负责证明数学陈述和解决几何问题。AlphaGeometry 2 在解决第四题时仅用 19 秒,展现了其强大的计算能力。此次成绩得到专业认证,显示了 AI 在数学领域的先进水平。

🔗 OpenAI 推出基于规则的奖励机制 RBR 提升 AI 安全性

OpenAI 为提高 AI 系统的安全性和与人类价值观的一致性,开发了一种新的奖励机制------基于规则的奖励(RBR)。RBR 通过定义一组命题和规则,自动执行模型微调,适应变化的安全政策,减少对人类数据的依赖。RBR 结合了固定语言模型的评估,拟合线性模型,与 PPO 算法结合,鼓励模型安全行为。实验表明,RBR 训练的模型在安全性能上与人类反馈训练的模型相当,同时减少了过度拒绝安全请求的情况,提高了训练效率和成本效益。此外,RBR 有助于快速更新安全准则,减少人工监督的需求,但仍需考虑潜在的偏见问题。

🔗 Open-Sora Plan v1.2 发布,清晰度、推理速度起飞

Open-Sora Plan v1.2 版本引入 3D 全注意力架构,极大提升了 AI 对物理世界的理解能力。新版本不仅增强了文本生成视频的能力,还通过优化 VAE 结构,显著提升了视频的清晰度和内容连贯性。同时,新架构完美融合了空间与时间维度,大幅提高了视频生成的空间表现力和时间流畅度。此外,推理速度的显著提升,让模型性能和效率得到飞跃。Open-Sora 团队的开源精神,将推动 AI 视频生成技术快速发展。

💫 企业动态

🔗 OpenAI 正式进军搜索!发布 SearchGPT:专挑谷歌不会的问题演示

OpenAI 推出 SearchGPT 原型,专注于解决与具体时空相关的问题,提供对话式答案和图片、链接等辅助信息。相较于谷歌等传统搜索引擎,SearchGPT 在时效性和个性化方面表现出色。目前处于收集反馈阶段,未来有望集成到 ChatGPT 中。用户可通过特定链接排队试用,体验这一创新搜索服务。

🔗 微软大动作:Bing 推出了基于 AI 的生成式搜索功能

微软 Bing 搜索引擎新增 AI 生成式搜索功能,标志着搜索技术的重大进步。AI 搜索引擎通过自然语言处理和生成模型,理解用户查询并以对话形式提供直接答案,极大提升了搜索效率。此举可能对传统搜索引擎霸主 Google 构成挑战。同时,其他 AI 搜索引擎如 Perplexity、秘塔 AI 搜索和 360AI 搜索也在市场中崭露头角,预示着搜索行业的未来趋势。

🔗 Reddit 被曝屏蔽多个搜索引擎和 AI 爬虫,官方称与谷歌合作无关

Reddit 近期更新了其 robots.txt 文件,全面禁止搜索引擎和 AI 爬虫抓取其网站内容。此举被认为与谷歌合作无关,Reddit 表示是因为抓取内容的商业实体增多并存在滥用情况。尽管 Bing、DuckDuckGo 等搜索引擎一度受到影响,但最新测试显示它们已重新显示 Reddit 的搜索内容。Reddit 发言人强调,与谷歌的合作不涉及此变动,且公司正在与多个搜索引擎讨论,但未能与所有搜索引擎就内容使用和 AI 训练达成协议。

🔗 百川智能回应 200 亿元估值:为 B 轮投前估值,A 轮总融资额达 50 亿元

百川智能近期宣布完成 A 轮融资,总金额 50 亿元人民币,以 200 亿元估值启动 B 轮融资。A 轮融资吸引了包括阿里、小米、腾讯等头部企业和多家国资背景投资基金。百川智能致力于医疗领域的 AI 应用,已发布 12 款大模型,包括最新推出的第四代基座大模型 Baichuan 4 和 AI 助手应用"百小应"。公司坚持"超级模型+超级应用"战略,医疗领域被视为超级应用的最佳场景。

🔗 AgentGPT 团队新作,四个人用 AI Agent 爬取整个公开网络,获投数百万美元

Reworkd 团队通过其 AgentGPT 工具在 GitHub 上爆红后���专注于利用 AI Agent 从公共网络中提取结构化数据。公司已从 YC、AI Grant 等投资者处筹集了 400 万美元资金。Reworkd 的 AI Agent 能够自动化抓取多个网站的数据,减少人工干预,提高效率。其技术优势在于能够处理大量小网站的数据抓取,避免传统网络抓取工具的高成本和复杂性。

🔗 小鹏汽车将于 7 月 30 日举行 AI 智驾技术发布会

根据小鹏汽车官方 7 月 25 日发布的消息,小鹏汽车将于 7 月 30 日 19:30 召开 AI 智能驾驶技术发布会。届时,小鹏 XNGP 系统将迎来其历史上最大的一次升级,同时小鹏 AI 天玑 XOS 5.2.0 版本也将展示出新的技术突破。

🔗 微软宣布与 Lumen Technologies 合作,扩展 AI 数据中心网络

微软为满足日益增长的 AI 服务需求,宣布与网络系统提供商 Lumen Technologies 建立合作伙伴关系。Lumen 将通过其 Private Connectivity Fabric 为微软提供专用光纤网络,增强数据中心间的连接能力,以支持 AI 基础设施的网络容量、性能、稳定性和速度。此次合作预计将为 Lumen 带来超过 2000 万美元的现金流增长。Lumen Technologies 自 1930 年成立以来,经历了多次变革,曾使用不同名称,直至 2020 年更名。

🔗 提前曝光 Llama 3.1,Meta 为什么想做「大模型界 Linux」?

Meta 公司开源了其大型参数模型 Llama 3.1,拥有 4050 亿个参数,旨在成为开源 AI 领域的行业标准。Llama 3.1 在多项基准测试中表现优异,尽管目前不支持多模态能力,但 Meta 正致力于添加图像、视频和语音识别功能。尽管模型开源,但运行和推理成本高昂,可能限制了其广泛应用。Meta 希望通过开源策略,建立开放的 AI 生态系统,推动 Llama 成为行业标准,同时鼓励开发者利用 Llama 进行微调和蒸馏,创建定制化的小模型。扎克伯格预测,Meta AI 将在未来几个月内使用量超过 ChatGPT,并成为最广泛使用的 AI 助手。

✨ 行业观点

🔗 彭博社公布 2024 最值得关注的 16 家 AI 初创公司,OpenAI 上榜

彭博社公布了 2024 年人工智能新锐企业排行榜,涵盖了 10 家规模最大、资金最充足的 AI 初创公司和 6 家重要后起之秀。其中,OpenAI 以 860 亿美元估值领先,Anthropic 和马斯克的 xAI 紧随其后。中国 AI 初创企业 01.AI(零一万物)由李开复创立,凭借其千亿参数模型 Yi-Large,获得 10 亿美元估值,成为榜单上唯一中国企业,显示了中美在 AI 领域的激烈竞争态势。

🔗 AI 生产力罗生门:96%老板力推 77%员工认为增加工作量

最新报告显示,96%的企业领导者认为 AI 能提高生产力,但 77%的员工觉得 AI 增加了工作量,47%的员工不知道如何提升生产力。85%的公司使用 AI,其中 39%强制使用。自由职业者对 AI 的熟练度和使用频率较高,但全职员工在满足生产率要求方面面临更多挑战。

🔗 腾讯、清华等多位生物大模型作者专访,畅谈 AI 生物学,解析大型细胞模型技术

多位顶尖科学家讨论了大型细胞模型(LCM)在生物学研究中的应用潜力。LCM 如 scBERT、Geneformer、scGPT 等展示了在单细胞转录组学等领域的巨大潜力,通过预训练和迁移学习,这些模型在细胞类型注释、基因网络预测等方面表现出色。专家还探讨了模型开发中的技术挑战和未来发展方向,强调了 AI 在推动生物学研究中的关键作用。

🔗 Perplexity CEO 谈 AI 搜索:做知识发现引擎,不是搜索引擎

Perplexity CEO Aravind Srinivas 在播客中讨论了 AI 搜索的未来,强调其目标是成为知识发现引擎而非传统搜索引擎,旨在通过更智能的方式帮助用户发现新知识和信息。

🔗 红杉美国合伙人:分发革命接近极限,下一次是计算革命!

红杉资本合伙人 Pat Grady 在 Cerebral Valley New York 大会上分享了对人工智能领域的洞见。他认为,当前 AI 模型已具备颠覆行业的能力,重点在于模型上的工程工作,如认知架构和推理。AI 将主要赋能服务行业,而非简单复制现有软件。Grady 预测,AI 将推动数万亿美元新业务的崛起,并强调模型稳定性对满足客户需求的重要性。他还指出,基础模型公司可能类似于数据库公司,而 OpenAI 则可能成为面向消费者的业务。

AGI 掘金成立于 2024 年7 月,是一家专注于 AGI 相关研究和应用的创新型 知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展,并将其应用于各个行业,为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务,致力于成为行业的领军者。AGI 掘金期待你的加入!

欢迎戳我加入 AGI 掘金飞书社群交流学习😊

相关推荐
herogus丶7 分钟前
【Spring AI】Spring AI Alibaba的简单使用
java·人工智能·spring·ai
dundunmm36 分钟前
机器学习之pandas
人工智能·python·机器学习·数据挖掘·pandas
小火炉Q1 小时前
16 循环语句——for循环
人工智能·python·网络安全
88号技师1 小时前
真实环境下实车运行,新能源汽车锂离子电池数据集
人工智能·电动汽车·电池状态估计
原点安全2 小时前
“鼎和财险一体化数据安全管控实践”入选信通院金融领域优秀案例
大数据·人工智能·金融
吃个糖糖2 小时前
37 Opencv SIFT 特征检测
人工智能·opencv·计算机视觉
麦田里的稻草人w2 小时前
【YOLO】(基础篇一)YOLO介绍
人工智能·python·神经网络·yolo·机器学习
BTColdman12 小时前
探索 Pencils Swap 的叙事:为 DeFi 的再次爆发蓄力
人工智能·区块链
Do1phln2 小时前
论文阅读 - 《Large Language Models Are Zero-Shot Time Series Forecasters》
论文阅读·人工智能·语言模型
小嗷犬2 小时前
【论文笔记】Visual Alignment Pre-training for Sign Language Translation
论文阅读·人工智能·机器翻译·多模态·手语翻译·手语识别