AI热点周报(8.24~8.30):Grok 2.5开源,OpenAI Realtime正式商用,Meta或与OpenAI或Google合作?

名人说:博观而约取,厚积而薄发。------苏轼《稼说送张琥》
创作者:Code_流苏(CSDN) (一个喜欢古诗词和编程的Coder😊)

目录

很高兴你打开了这篇博客,更多AI知识,请关注我、订阅专栏《AI知识图谱》,内容持续更新中...

大家好,我是流苏👋 ,今天我们一起了解一下本周的一些AI热点

python 复制代码
- 如果你想看简单版,下面笔者整理了3分钟速览版,放到了表格里,可以查看

一、3分钟速览版:一张表看懂本周AI大事

日期 机构/产品 动作 一句话影响
8/28 OpenAI Realtime API / gpt-realtime 正式商用,支持SIP电话远程MCP工具图片输入,并降价 语音座席不再停留在Demo,进入可规模落地阶段。 ([OpenAI](https://openai.com/index/introducing-gpt-realtime/ "Introducing gpt-realtime and Realtime API updates for production voice agents
8/27 Anthropic Claude 发布AI滥用威胁情报与典型案例(勒索、朝鲜远程用工诈骗、RaaS) 安全攻防进入"对抗真实犯罪场景"的新阶段。 (Anthropic)
8/27 OpenAI × Anthropic 联合公布一次安全评估做法与结果 头部公司在评测与治理上出现协作苗头。 ([OpenAI](https://openai.com/index/openai-anthropic-safety-evaluation/ "Findings from a pilot Anthropic–OpenAI alignment evaluation exercise: OpenAI Safety Tests
8/28 Microsoft Copilot 上线三星2025款TV/显示器,客厅可直接呼叫AI助理 AI从电脑和手机"走进客厅屏"。 (The Verge, Forbes)
8/30 Meta 与员工讨论是否在产品中调用OpenAI或Google的模型 大厂更务实:在"自研/外采"之间动态取舍。 (Reuters)
8/24 xAI Grok 2.5 部分开源/算法公开,持续推进开放路线 开源/公开策略成为差异化竞争点。 (TechCrunch)

二、OpenAI:gpt-realtime 上线,语音智能终于"可落地"

1. 发生了什么?

OpenAI宣布 Realtime API 全面可用,并推出新的语音到语音 模型 gpt-realtime。要点包括:

  • 通话级能力 :原生支持SIP,可把AI座席接入公网电话/PBX/座机;
  • 工具扩展 :会话内支持远程 MCP(Model Context Protocol)服务器,像"热插拔"一样给座席挂接新工具;
  • 多模态输入 :语音会话里可以补充图片/截图,让AI基于"看得见"的内容回答;
  • 成本与时延 :相较旧版预览,价格下降并强调低时延,更贴近生产;
  • 适配异步函数调用 ,长耗时工具不再打断对话。 (OpenAI)

2. 小案例:3步把客服热线接进AI

(1)把现有电话系统的SIP信息写入会话配置;

(2)在会话中注册业务工具(如check_orderrefund),也可通过MCP把外部系统挂进来;

(3)在system里定规则(话术/合规)+可复用的Prompt模板

这样,一个能打电话、会查系统、懂流程 的AI坐席就能在真实客服里跑起来了。上述能力均来自本次Realtime的原生支持。 (OpenAI)

三、AI安全:Claude"反滥用"报告+头部联测的信号

1. 真实世界的三类滥用

Anthropic发布8月安全情报:

  1. "Agent化勒索" :攻击者用 Claude Code 自动化内网侦察、数据窃取与勒索话术生成;
  2. 朝鲜远程用工诈骗:用大模型伪造身份、通过笔试、"保住岗位";
  3. RaaS(勒索即服务) :低技术门槛的攻击者在AI辅助下售卖勒索套件。
    针对这些,Anthropic通报了封禁与检测器 更新,并与相关部门共享技术指标。 (Anthropic)

补充:安全社区亦有第三方报道对这些滥用手法进行归纳,侧面印证其广度与严重性 。(BleepingComputer)

2. 头部公司"联合评估"的启示

OpenAI与Anthropic公开了一次联合安全评估 的做法和经验,讨论了如何在"边发布、边治理"的节奏里,形成跨公司协作的评测与基线。

对行业意味着:不只是"各家自测",而是共享评估思路对抗样本 ,把"安全红线"进一步社会化。 (OpenAI)

四、产品线升级:Gemini、VLM与多终端

1. Google:Gemini Live 持续迭代

谷歌本周更新了 Gemini Live 的页面与能力说明,强调实时语音对话的稳定性/隐私与更多可用平台,并与安卓生态应用做打通;

开发者面向的图像创建/编辑 (如 Gemini 2.5 Flash Image)继续推进。

对于用户而言,语音+视觉的一体化交互在手机端Web端 都更顺手了。 (blog.google, Google DeepMind)

2. Microsoft:Copilot 进入客厅屏

微软与三星宣布:Copilot 上线2025款电视与智能显示器,支持语音互动、内容推荐 与"剧情回顾 "等场景。AI第一次以"常驻形象"进入客厅大屏,形态从App升级为"家庭数字伙伴 "。 (The Verge, Forbes)

五、生态与竞争:外采模型、开放策略与"谁用谁"

  • Meta 在内部讨论是否在部分产品中直接调用OpenAI/Google模型 。这释放了一个信号:当体验/时效 优先时,大厂也可能在自研与外采间切换,以达到"最好用 "的目标。 (Reuters)
  • xAI 在8/24进一步公开Grok 2.5 相关资源/代码,延续开放姿态,加速社区复现与评测。对比"闭源领先"的路线,开放框架有利于快速迭代人才吸引 。 (TechCrunch)

结语

这一周的主线很清晰:语音智能 从"炫技"走向"可用",安全对抗 从"规则"走向"实战",生态竞争 从"闭门造车"走向"灵活拼装"。对团队而言,一个能打电话、会用工具、可落地的AI座席一套能对抗真实滥用的安全基线,就是现在值得投入的两件事。

随着AI的发展,更贴近人类日常使用的模型会越来越多,相应着随着AI能力的提升,AI的安全性也需随之提升。

参考与来源(节选)

  • OpenAI:gpt-realtime与Realtime API更新 、SIP/MCP/图片输入、定价与可用性。(OpenAI)
  • OpenAI × Anthropic:联合安全评估 做法与结论。(OpenAI)
  • Anthropic:AI滥用威胁情报(8月)与三类真实案例。(Anthropic)
  • Microsoft × Samsung:Copilot上电视/显示器 ,媒体报道与落地细节。(The Verge, Forbes)
  • Meta:讨论外部模型接入 (路透)。(Reuters)
  • xAI:Grok 2.5开放动作 (TechCrunch,另有路透跟进)。(TechCrunch)
  • Google/DeepMind:Gemini Live2.5 Flash Image 能力页面。(blog.google, Google DeepMind)
  • 政策环境:美国州级AI立法加速 (Investopedia汇总)。(Investopedia)
    创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)