AI 科技日报 (通义新开源模型27B参数打赢编程旗舰)

AI 科技日报 (通义新开源模型27B参数打赢编程旗舰)

共收录 28 条资讯

AI模型

  1. 通义千问3.6-27B:27B参数打赢旗舰编程 --- 阿里通义千问团队发布了Qwen3.6-27B, 🔗

27B参数在编程能力上超越了更大规模的模型,目前开源最强的编程选手,可以本地运行。

  1. Kimi K2.6 Agent Swarm:300并发代理单次产10万字 --- Moonshot发布了Kimi K2.6 Agent Swarm, 🔗

代理集群规模翻倍,单次能产出一份完整综述或100多个文件,性价比极高,已经影响到商业模型的定价策略。

  1. Google Vision Banana:图生一体统一模型 --- Google推出了Vision Banana, 🔗

图生和图理解合二为一,Google多模态路线图里的新拼图。

  1. OpenAI 暗示 SPUD/GPT-5.5 或于周四发布 --- OpenAI 在 X 上放出了一张土豆图片, 🔗

OpenAI 官方发了一张土豆图,配上暗示性文案,圈内人基本确定是 GPT-5.5 要来了,而且很可能就在周四。

  1. ChatGPT Images 2.0:上传房屋照直接生成户型图 --- ChatGPT 新图像模型发布不到两天, 🔗

ChatGPT 图生图新能力曝光,户型图生成和分镜制作等实际应用场景已经跑通,确实比现有模型强一截。

  1. 多智能体自进化基础设施开源 --- 一个面向多智能体系统的自进化基础设施项目开源, 🔗

多 Agent 自进化框架开源,探讨 Agent 群体如何协作和自我改进,适合研究型开发者关注。

  1. Seed3D 2.0发布:几何纹理双SOTA,API已上线火山引擎 --- 字节跳动Seed团队发布新一代3D生成大模型Seed3D 2.0, 🔗

3D生成终于在几何和纹理两个维度都做到SOTA了,不再是只能看不能用的demo。

  1. 小米MiMo-V2.5公测:4.3小时完成编译器任务 --- 小米MiMo-V2.5系列开启公测, 🔗

小米大模型在编程任务上追上了头部玩家,4.3小时手搓编译器这事挺实在的。

产品发布

  1. OpenAI推出ChatGPT临床版 --- OpenAI发布了面向临床医生的ChatGPT版本(ChatGPT f... 🔗

ChatGPT出医疗专用版,临床医生可以免费用AI辅助诊疗了。

  1. Claude 桌面版官方支持第三方 API,中转站用户受益 --- Claude 桌面应用现在可以配置第三方 API, 🔗

Claude 桌面版终于原生支持第三方 API,绕过官方账号直接调用,中转站用户可以光明正大用了。

  1. HeyGen HyperFrames 支持拖拽预览直接编辑时间线 --- HeyGen 旗下的 HyperFrames 新增时间线直接编辑功能, 🔗

HeyGen 视频编辑加了拖拽预览直接改时间线的功能,补齐了之前 AI 视频工具的一个短板。

  1. OpenAI Workspace Agents:GPTs升级到agent时代 --- OpenAI正式推出Workspace Agents, 🔗

GPTs升级成能自动执行任务的agent,云端运行,直接集成Slack等办公平台。

  1. Google推出Gemini企业代理平台 --- Google DeepMind联合Google Cloud发布了Gem... 🔗

Google的企业agent平台来了,从Vertex AI升级,支持模型选择和安全集成。

研究论文

  1. 索尼发布乒乓球机器人Ace:强化学习落地机器人 --- 索尼在Nature发表论文,展示了名为Ace的自主乒乓球机器人。 🔗

索尼机器人打乒乓球达到专家水平,RL在实体任务落地了。

  1. Google DeepMind 发布 Vision Banana 论文:图像生成器是通用视觉学习者 --- Google DeepMind 团队发表论文, 🔗

Google DeepMind 发了篇论文,证明图像生成模型本质上也是视觉学习器,一鱼两吃那种。

  1. Poly-EPO:解决RL微调导致LLM输出趋同问题 --- 强化学习微调容易让LLM的输出熵过早崩溃------模型变得只会重复正确答案, 🔗

RL微调容易让模型输出变得死板,Poly-EPO用set-RL保持多样性的同时确保正确性。

  1. TACO框架:让长周期agent自己学会压缩上下文 --- TACO是一个自进化框架, 🔗

长周期任务agent容易在上下文里迷失,TACO让agent自己学会压缩上下文,wrapper形式直接可用。

  1. GiantsBench:测试LLM能否产生新科学洞见 --- GiantsBench是一个新的科学发现基准测试, 🔗

行业动态

  1. Anthropic产品口碑下滑遭质疑 --- 多位AI从业者指出Anthropic产品力下降且缺乏透明沟通。 🔗

Claude系列被质疑不行了,Anthropic沉默应对引发社区不满。

  1. Seedance 2.0 推出优惠套餐,每秒 720p 仅 0.1 美元 --- Seedance 2.0 视频生成模型推出更实惠的套餐计划, 🔗

Seedance 2.0 降价抢市场,和 GPT Image 2.0 组合使用是目前成本最低的 AI 视频方案之一。

  1. Claude Code获Webby奖,AI编程工具获认可 --- Anthropic的AI编程工具Claude Code获得了Webby... 🔗

Claude Code拿奖了,AI编程工具进入主流奖项视野。

  1. F Chollet:评估AGI不该看模仿能力 --- Keras作者F Chollet发推指出, 🔗

F Chollet认为用模仿人类来定义AGI是个错误,智能应该体现在学会未知任务的能力上。

  1. Yann LeCun:AI行业陷入LLM路径依赖 --- Yann LeCun转发了别人对他的引用, 🔗

LeCun提醒行业都在跟风LLM,多元化探索不足。


关注我,每天获取AI最新资讯。

相关推荐
Sherlock Ma1 天前
西瓜书《机器学习》全网最详细解读 第一章:绪论
人工智能·深度学习·考研·机器学习·学习方法·西瓜书·改行学it
烟锁池塘柳01 天前
【机器学习】一文彻底搞懂正则化(Regularization)
人工智能·深度学习·机器学习
一个天蝎座 白勺 程序猿1 天前
从AlphaGo到ChatGPT:机器学习基础概念的全景式拆解与工程实践思考
人工智能·机器学习·chatgpt
Luhui Dev1 天前
Anthropic 2026 最新 Agent Harness 架构完整拆解:Managed Agents
人工智能·架构·agent·luhuidev
OurBMC社区1 天前
玩转OurBMC第二十七期:BMC POST CODE解读
开源·ourbmc
skywalk81631 天前
安装superpowers-zh (AI 编程超能力 · 中文增强版)
人工智能
经济元宇宙1 天前
摄影培训行业百科:机构选择与学习路径全解析
大数据·人工智能·学习
哥只是传说中的小白1 天前
GrsaiApi官方正版字字动画插件!支持nano banana pro和gpt-image-2模型
人工智能·gpt·ai作画·开源·aigc·api
GJGCY1 天前
企业AI Agent落地架构深度解析:LLM+RAG+RPA+工具调用全流程
大数据·人工智能·ai·数字化·智能体
刀法如飞1 天前
Ontology本体论是什么数据结构?Palantir 技术原理介绍
数据结构·人工智能·ai编程·图论