AI 科技日报 (通义新开源模型27B参数打赢编程旗舰)

AI 科技日报 (通义新开源模型27B参数打赢编程旗舰)

共收录 28 条资讯

AI模型

  1. 通义千问3.6-27B:27B参数打赢旗舰编程 --- 阿里通义千问团队发布了Qwen3.6-27B, 🔗

27B参数在编程能力上超越了更大规模的模型,目前开源最强的编程选手,可以本地运行。

  1. Kimi K2.6 Agent Swarm:300并发代理单次产10万字 --- Moonshot发布了Kimi K2.6 Agent Swarm, 🔗

代理集群规模翻倍,单次能产出一份完整综述或100多个文件,性价比极高,已经影响到商业模型的定价策略。

  1. Google Vision Banana:图生一体统一模型 --- Google推出了Vision Banana, 🔗

图生和图理解合二为一,Google多模态路线图里的新拼图。

  1. OpenAI 暗示 SPUD/GPT-5.5 或于周四发布 --- OpenAI 在 X 上放出了一张土豆图片, 🔗

OpenAI 官方发了一张土豆图,配上暗示性文案,圈内人基本确定是 GPT-5.5 要来了,而且很可能就在周四。

  1. ChatGPT Images 2.0:上传房屋照直接生成户型图 --- ChatGPT 新图像模型发布不到两天, 🔗

ChatGPT 图生图新能力曝光,户型图生成和分镜制作等实际应用场景已经跑通,确实比现有模型强一截。

  1. 多智能体自进化基础设施开源 --- 一个面向多智能体系统的自进化基础设施项目开源, 🔗

多 Agent 自进化框架开源,探讨 Agent 群体如何协作和自我改进,适合研究型开发者关注。

  1. Seed3D 2.0发布:几何纹理双SOTA,API已上线火山引擎 --- 字节跳动Seed团队发布新一代3D生成大模型Seed3D 2.0, 🔗

3D生成终于在几何和纹理两个维度都做到SOTA了,不再是只能看不能用的demo。

  1. 小米MiMo-V2.5公测:4.3小时完成编译器任务 --- 小米MiMo-V2.5系列开启公测, 🔗

小米大模型在编程任务上追上了头部玩家,4.3小时手搓编译器这事挺实在的。

产品发布

  1. OpenAI推出ChatGPT临床版 --- OpenAI发布了面向临床医生的ChatGPT版本(ChatGPT f... 🔗

ChatGPT出医疗专用版,临床医生可以免费用AI辅助诊疗了。

  1. Claude 桌面版官方支持第三方 API,中转站用户受益 --- Claude 桌面应用现在可以配置第三方 API, 🔗

Claude 桌面版终于原生支持第三方 API,绕过官方账号直接调用,中转站用户可以光明正大用了。

  1. HeyGen HyperFrames 支持拖拽预览直接编辑时间线 --- HeyGen 旗下的 HyperFrames 新增时间线直接编辑功能, 🔗

HeyGen 视频编辑加了拖拽预览直接改时间线的功能,补齐了之前 AI 视频工具的一个短板。

  1. OpenAI Workspace Agents:GPTs升级到agent时代 --- OpenAI正式推出Workspace Agents, 🔗

GPTs升级成能自动执行任务的agent,云端运行,直接集成Slack等办公平台。

  1. Google推出Gemini企业代理平台 --- Google DeepMind联合Google Cloud发布了Gem... 🔗

Google的企业agent平台来了,从Vertex AI升级,支持模型选择和安全集成。

研究论文

  1. 索尼发布乒乓球机器人Ace:强化学习落地机器人 --- 索尼在Nature发表论文,展示了名为Ace的自主乒乓球机器人。 🔗

索尼机器人打乒乓球达到专家水平,RL在实体任务落地了。

  1. Google DeepMind 发布 Vision Banana 论文:图像生成器是通用视觉学习者 --- Google DeepMind 团队发表论文, 🔗

Google DeepMind 发了篇论文,证明图像生成模型本质上也是视觉学习器,一鱼两吃那种。

  1. Poly-EPO:解决RL微调导致LLM输出趋同问题 --- 强化学习微调容易让LLM的输出熵过早崩溃------模型变得只会重复正确答案, 🔗

RL微调容易让模型输出变得死板,Poly-EPO用set-RL保持多样性的同时确保正确性。

  1. TACO框架:让长周期agent自己学会压缩上下文 --- TACO是一个自进化框架, 🔗

长周期任务agent容易在上下文里迷失,TACO让agent自己学会压缩上下文,wrapper形式直接可用。

  1. GiantsBench:测试LLM能否产生新科学洞见 --- GiantsBench是一个新的科学发现基准测试, 🔗

行业动态

  1. Anthropic产品口碑下滑遭质疑 --- 多位AI从业者指出Anthropic产品力下降且缺乏透明沟通。 🔗

Claude系列被质疑不行了,Anthropic沉默应对引发社区不满。

  1. Seedance 2.0 推出优惠套餐,每秒 720p 仅 0.1 美元 --- Seedance 2.0 视频生成模型推出更实惠的套餐计划, 🔗

Seedance 2.0 降价抢市场,和 GPT Image 2.0 组合使用是目前成本最低的 AI 视频方案之一。

  1. Claude Code获Webby奖,AI编程工具获认可 --- Anthropic的AI编程工具Claude Code获得了Webby... 🔗

Claude Code拿奖了,AI编程工具进入主流奖项视野。

  1. F Chollet:评估AGI不该看模仿能力 --- Keras作者F Chollet发推指出, 🔗

F Chollet认为用模仿人类来定义AGI是个错误,智能应该体现在学会未知任务的能力上。

  1. Yann LeCun:AI行业陷入LLM路径依赖 --- Yann LeCun转发了别人对他的引用, 🔗

LeCun提醒行业都在跟风LLM,多元化探索不足。


关注我,每天获取AI最新资讯。

相关推荐
黎阳之光1 小时前
黎阳之光:以视频孪生硬核实力,抢抓交通科技新机遇
大数据·人工智能·算法·安全·数字孪生
扬帆破浪1 小时前
免费开源的WPS AI插件 察元AI助手:generateMultimodalAsset:类型校验与分支派发
人工智能·开源·ai编程·wps
人工小情绪1 小时前
GPT-1 论文深度解读
人工智能·gpt·大模型·transformer
月落归舟2 小时前
如何理解超火的Agent Harness
人工智能
ybdesire2 小时前
codex报错解决 Error loading config.toml: `wire_api = “chat“` is no longer supported
人工智能·ai·codex·智能体
工作log2 小时前
基于 RuoYi-Vue-Plus + DeepSeek 实现 AI 在线考试系统(试卷生成与批量阅卷
人工智能
Web3VentureView2 小时前
SYNBO亮相香港《前瞻》活动,联手HashKey共筑链上原生一级市场新范式
人工智能·web3·区块链·加密货币·synbo
沪漂阿龙2 小时前
深度强化学习入门:从倒立摆游戏看懂AI如何“自己学会走路”
人工智能·游戏
gongfuyd2 小时前
MAPPO中V(s)作为基线的含义及基线定义
人工智能