59-260512 AI 科技日报(Gemini 视频模型曝光、DeepSeek V4 限时免费、OpenAI 布局企业部署)
AI模型
- Gemini Omni 视频模型曝光 --- 谷歌 Gemini 应用出现 "Omni 视频模型" 痕迹,可聊天式编辑和生成视频;全能模型也将开放 API,面向复杂 Agent 任务。 🔗
- DeepSeek V4 Flash 限时免费 --- OpenCode 平台限时免费提供 DeepSeek V4 Flash,在 Go 编程场景中口碑不错。 🔗
- Qwen 3.6 Plus 限时免费 --- Nous Portal 限时免费开放 Qwen 3.6 Plus,平台已聚合 300 多种模型,可以一站式体验不同模型。 🔗
- MiniCPM-V 4.6 开源 --- OpenBMB 开源端侧多模态模型 MiniCPM-V 4.6,针对手机等边缘设备优化了运行效率和多模态能力。 🔗
产品发布
- Claude Code 推出 Agent 视图 --- 新增 Agent 视图管理多会话,同步更新 50 余项 CLI 变化,
/goal命令支持跨轮次任务跟踪。 🔗 - Cursor 集成 Microsoft Teams --- 在 Teams 频道内通过 @ 调用 Cursor 分配编程任务或查询代码信息。 🔗
- Cursor Bugbot 支持自定义审查深度 --- 可对重要代码变更启用高努力模式,把更多算力分配给关键 review。 🔗
- 通义千问接入淘宝 --- 深度整合进淘宝 App,支持对话式购物、虚拟试穿等 AI 交互。 🔗
研究论文
- FrontierMath 基准约三成题目有错 --- GPT 5.5 检验出数学基准 FrontierMath 约三分之一题目存在错误,AI 数学能力的评估结论可能要打折。 🔗
工具推荐
- Karpathy:让 LLM 直接生成 HTML --- 直接让 LLM 输出 HTML 在浏览器展示,利用模型对 Web 技术的熟悉度快速产出可视化结果。 🔗
- Hermes Agent 实现通用计算机操作 --- Nous Research 推出 Hermes Agent,结合 Cua 技术,任意 LLM 都能操控鼠标键盘完成计算机任务。 🔗
行业动态
- OpenAI 成立 Deployment 公司 --- 联合 19 家投资与咨询机构组成伙伴网络,帮企业把前沿模型部署到生产环境。 🔗
- 快手可灵 AI 拟独立融资 --- 快手计划将可灵 AI 分拆独立,估值 200 亿美元,目标明年 IPO。 🔗
- OpenAI 推出 AI 网络防御工具 Daybreak --- 斥资 40 亿美元成立新公司,进入网络安全领域。 🔗
关注我,每天获取AI最新资讯。
