AI 科技日报 (通义新开源模型27B参数打赢编程旗舰)

AI 科技日报 (通义新开源模型27B参数打赢编程旗舰)

共收录 28 条资讯

AI模型

  1. 通义千问3.6-27B:27B参数打赢旗舰编程 --- 阿里通义千问团队发布了Qwen3.6-27B, 🔗

27B参数在编程能力上超越了更大规模的模型,目前开源最强的编程选手,可以本地运行。

  1. Kimi K2.6 Agent Swarm:300并发代理单次产10万字 --- Moonshot发布了Kimi K2.6 Agent Swarm, 🔗

代理集群规模翻倍,单次能产出一份完整综述或100多个文件,性价比极高,已经影响到商业模型的定价策略。

  1. Google Vision Banana:图生一体统一模型 --- Google推出了Vision Banana, 🔗

图生和图理解合二为一,Google多模态路线图里的新拼图。

  1. OpenAI 暗示 SPUD/GPT-5.5 或于周四发布 --- OpenAI 在 X 上放出了一张土豆图片, 🔗

OpenAI 官方发了一张土豆图,配上暗示性文案,圈内人基本确定是 GPT-5.5 要来了,而且很可能就在周四。

  1. ChatGPT Images 2.0:上传房屋照直接生成户型图 --- ChatGPT 新图像模型发布不到两天, 🔗

ChatGPT 图生图新能力曝光,户型图生成和分镜制作等实际应用场景已经跑通,确实比现有模型强一截。

  1. 多智能体自进化基础设施开源 --- 一个面向多智能体系统的自进化基础设施项目开源, 🔗

多 Agent 自进化框架开源,探讨 Agent 群体如何协作和自我改进,适合研究型开发者关注。

  1. Seed3D 2.0发布:几何纹理双SOTA,API已上线火山引擎 --- 字节跳动Seed团队发布新一代3D生成大模型Seed3D 2.0, 🔗

3D生成终于在几何和纹理两个维度都做到SOTA了,不再是只能看不能用的demo。

  1. 小米MiMo-V2.5公测:4.3小时完成编译器任务 --- 小米MiMo-V2.5系列开启公测, 🔗

小米大模型在编程任务上追上了头部玩家,4.3小时手搓编译器这事挺实在的。

产品发布

  1. OpenAI推出ChatGPT临床版 --- OpenAI发布了面向临床医生的ChatGPT版本(ChatGPT f... 🔗

ChatGPT出医疗专用版,临床医生可以免费用AI辅助诊疗了。

  1. Claude 桌面版官方支持第三方 API,中转站用户受益 --- Claude 桌面应用现在可以配置第三方 API, 🔗

Claude 桌面版终于原生支持第三方 API,绕过官方账号直接调用,中转站用户可以光明正大用了。

  1. HeyGen HyperFrames 支持拖拽预览直接编辑时间线 --- HeyGen 旗下的 HyperFrames 新增时间线直接编辑功能, 🔗

HeyGen 视频编辑加了拖拽预览直接改时间线的功能,补齐了之前 AI 视频工具的一个短板。

  1. OpenAI Workspace Agents:GPTs升级到agent时代 --- OpenAI正式推出Workspace Agents, 🔗

GPTs升级成能自动执行任务的agent,云端运行,直接集成Slack等办公平台。

  1. Google推出Gemini企业代理平台 --- Google DeepMind联合Google Cloud发布了Gem... 🔗

Google的企业agent平台来了,从Vertex AI升级,支持模型选择和安全集成。

研究论文

  1. 索尼发布乒乓球机器人Ace:强化学习落地机器人 --- 索尼在Nature发表论文,展示了名为Ace的自主乒乓球机器人。 🔗

索尼机器人打乒乓球达到专家水平,RL在实体任务落地了。

  1. Google DeepMind 发布 Vision Banana 论文:图像生成器是通用视觉学习者 --- Google DeepMind 团队发表论文, 🔗

Google DeepMind 发了篇论文,证明图像生成模型本质上也是视觉学习器,一鱼两吃那种。

  1. Poly-EPO:解决RL微调导致LLM输出趋同问题 --- 强化学习微调容易让LLM的输出熵过早崩溃------模型变得只会重复正确答案, 🔗

RL微调容易让模型输出变得死板,Poly-EPO用set-RL保持多样性的同时确保正确性。

  1. TACO框架:让长周期agent自己学会压缩上下文 --- TACO是一个自进化框架, 🔗

长周期任务agent容易在上下文里迷失,TACO让agent自己学会压缩上下文,wrapper形式直接可用。

  1. GiantsBench:测试LLM能否产生新科学洞见 --- GiantsBench是一个新的科学发现基准测试, 🔗

行业动态

  1. Anthropic产品口碑下滑遭质疑 --- 多位AI从业者指出Anthropic产品力下降且缺乏透明沟通。 🔗

Claude系列被质疑不行了,Anthropic沉默应对引发社区不满。

  1. Seedance 2.0 推出优惠套餐,每秒 720p 仅 0.1 美元 --- Seedance 2.0 视频生成模型推出更实惠的套餐计划, 🔗

Seedance 2.0 降价抢市场,和 GPT Image 2.0 组合使用是目前成本最低的 AI 视频方案之一。

  1. Claude Code获Webby奖,AI编程工具获认可 --- Anthropic的AI编程工具Claude Code获得了Webby... 🔗

Claude Code拿奖了,AI编程工具进入主流奖项视野。

  1. F Chollet:评估AGI不该看模仿能力 --- Keras作者F Chollet发推指出, 🔗

F Chollet认为用模仿人类来定义AGI是个错误,智能应该体现在学会未知任务的能力上。

  1. Yann LeCun:AI行业陷入LLM路径依赖 --- Yann LeCun转发了别人对他的引用, 🔗

LeCun提醒行业都在跟风LLM,多元化探索不足。


关注我,每天获取AI最新资讯。

相关推荐
冬奇Lab2 小时前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab3 小时前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
程序员cxuan5 小时前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员
ZhengEnCi7 小时前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒7 小时前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
不加辣椒8 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户1693176172668 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟8 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户2527362781410 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩10 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent