AI 科技日报 (通义新开源模型27B参数打赢编程旗舰)

共收录 28 条资讯

AI模型

通义千问3.6-27B：27B参数打赢旗舰编程 --- 阿里通义千问团队发布了Qwen3.6-27B， 🔗

27B参数在编程能力上超越了更大规模的模型，目前开源最强的编程选手，可以本地运行。

Kimi K2.6 Agent Swarm：300并发代理单次产10万字 --- Moonshot发布了Kimi K2.6 Agent Swarm， 🔗

代理集群规模翻倍，单次能产出一份完整综述或100多个文件，性价比极高，已经影响到商业模型的定价策略。

Google Vision Banana：图生一体统一模型 --- Google推出了Vision Banana， 🔗

图生和图理解合二为一，Google多模态路线图里的新拼图。

OpenAI 暗示 SPUD/GPT-5.5 或于周四发布 --- OpenAI 在 X 上放出了一张土豆图片， 🔗

OpenAI 官方发了一张土豆图，配上暗示性文案，圈内人基本确定是 GPT-5.5 要来了，而且很可能就在周四。

ChatGPT Images 2.0：上传房屋照直接生成户型图 --- ChatGPT 新图像模型发布不到两天， 🔗

ChatGPT 图生图新能力曝光，户型图生成和分镜制作等实际应用场景已经跑通，确实比现有模型强一截。

多智能体自进化基础设施开源 --- 一个面向多智能体系统的自进化基础设施项目开源， 🔗

多 Agent 自进化框架开源，探讨 Agent 群体如何协作和自我改进，适合研究型开发者关注。

Seed3D 2.0发布：几何纹理双SOTA，API已上线火山引擎 --- 字节跳动Seed团队发布新一代3D生成大模型Seed3D 2.0， 🔗

3D生成终于在几何和纹理两个维度都做到SOTA了，不再是只能看不能用的demo。

小米MiMo-V2.5公测：4.3小时完成编译器任务 --- 小米MiMo-V2.5系列开启公测， 🔗

小米大模型在编程任务上追上了头部玩家，4.3小时手搓编译器这事挺实在的。

产品发布

OpenAI推出ChatGPT临床版 --- OpenAI发布了面向临床医生的ChatGPT版本（ChatGPT f... 🔗

ChatGPT出医疗专用版，临床医生可以免费用AI辅助诊疗了。

Claude 桌面版官方支持第三方 API，中转站用户受益 --- Claude 桌面应用现在可以配置第三方 API， 🔗

Claude 桌面版终于原生支持第三方 API，绕过官方账号直接调用，中转站用户可以光明正大用了。

HeyGen HyperFrames 支持拖拽预览直接编辑时间线 --- HeyGen 旗下的 HyperFrames 新增时间线直接编辑功能， 🔗

HeyGen 视频编辑加了拖拽预览直接改时间线的功能，补齐了之前 AI 视频工具的一个短板。

OpenAI Workspace Agents：GPTs升级到agent时代 --- OpenAI正式推出Workspace Agents， 🔗

GPTs升级成能自动执行任务的agent，云端运行，直接集成Slack等办公平台。

Google推出Gemini企业代理平台 --- Google DeepMind联合Google Cloud发布了Gem... 🔗

Google的企业agent平台来了，从Vertex AI升级，支持模型选择和安全集成。

研究论文

索尼发布乒乓球机器人Ace：强化学习落地机器人 --- 索尼在Nature发表论文，展示了名为Ace的自主乒乓球机器人。 🔗

索尼机器人打乒乓球达到专家水平，RL在实体任务落地了。

Google DeepMind 发布 Vision Banana 论文：图像生成器是通用视觉学习者 --- Google DeepMind 团队发表论文， 🔗

Google DeepMind 发了篇论文，证明图像生成模型本质上也是视觉学习器，一鱼两吃那种。

Poly-EPO：解决RL微调导致LLM输出趋同问题 --- 强化学习微调容易让LLM的输出熵过早崩溃------模型变得只会重复正确答案， 🔗

RL微调容易让模型输出变得死板，Poly-EPO用set-RL保持多样性的同时确保正确性。

TACO框架：让长周期agent自己学会压缩上下文 --- TACO是一个自进化框架， 🔗

长周期任务agent容易在上下文里迷失，TACO让agent自己学会压缩上下文，wrapper形式直接可用。

GiantsBench：测试LLM能否产生新科学洞见 --- GiantsBench是一个新的科学发现基准测试， 🔗

行业动态

Anthropic产品口碑下滑遭质疑 --- 多位AI从业者指出Anthropic产品力下降且缺乏透明沟通。 🔗

Claude系列被质疑不行了，Anthropic沉默应对引发社区不满。

Seedance 2.0 推出优惠套餐，每秒 720p 仅 0.1 美元 --- Seedance 2.0 视频生成模型推出更实惠的套餐计划， 🔗

Seedance 2.0 降价抢市场，和 GPT Image 2.0 组合使用是目前成本最低的 AI 视频方案之一。

Claude Code获Webby奖，AI编程工具获认可 --- Anthropic的AI编程工具Claude Code获得了Webby... 🔗

Claude Code拿奖了，AI编程工具进入主流奖项视野。

F Chollet：评估AGI不该看模仿能力 --- Keras作者F Chollet发推指出， 🔗

F Chollet认为用模仿人类来定义AGI是个错误，智能应该体现在学会未知任务的能力上。

Yann LeCun：AI行业陷入LLM路径依赖 --- Yann LeCun转发了别人对他的引用， 🔗

LeCun提醒行业都在跟风LLM，多元化探索不足。

关注我，每天获取AI最新资讯。