AI 科技日报 (通义新开源模型27B参数打赢编程旗舰)

AI 科技日报 (通义新开源模型27B参数打赢编程旗舰)

共收录 28 条资讯

AI模型

  1. 通义千问3.6-27B:27B参数打赢旗舰编程 --- 阿里通义千问团队发布了Qwen3.6-27B, 🔗

27B参数在编程能力上超越了更大规模的模型,目前开源最强的编程选手,可以本地运行。

  1. Kimi K2.6 Agent Swarm:300并发代理单次产10万字 --- Moonshot发布了Kimi K2.6 Agent Swarm, 🔗

代理集群规模翻倍,单次能产出一份完整综述或100多个文件,性价比极高,已经影响到商业模型的定价策略。

  1. Google Vision Banana:图生一体统一模型 --- Google推出了Vision Banana, 🔗

图生和图理解合二为一,Google多模态路线图里的新拼图。

  1. OpenAI 暗示 SPUD/GPT-5.5 或于周四发布 --- OpenAI 在 X 上放出了一张土豆图片, 🔗

OpenAI 官方发了一张土豆图,配上暗示性文案,圈内人基本确定是 GPT-5.5 要来了,而且很可能就在周四。

  1. ChatGPT Images 2.0:上传房屋照直接生成户型图 --- ChatGPT 新图像模型发布不到两天, 🔗

ChatGPT 图生图新能力曝光,户型图生成和分镜制作等实际应用场景已经跑通,确实比现有模型强一截。

  1. 多智能体自进化基础设施开源 --- 一个面向多智能体系统的自进化基础设施项目开源, 🔗

多 Agent 自进化框架开源,探讨 Agent 群体如何协作和自我改进,适合研究型开发者关注。

  1. Seed3D 2.0发布:几何纹理双SOTA,API已上线火山引擎 --- 字节跳动Seed团队发布新一代3D生成大模型Seed3D 2.0, 🔗

3D生成终于在几何和纹理两个维度都做到SOTA了,不再是只能看不能用的demo。

  1. 小米MiMo-V2.5公测:4.3小时完成编译器任务 --- 小米MiMo-V2.5系列开启公测, 🔗

小米大模型在编程任务上追上了头部玩家,4.3小时手搓编译器这事挺实在的。

产品发布

  1. OpenAI推出ChatGPT临床版 --- OpenAI发布了面向临床医生的ChatGPT版本(ChatGPT f... 🔗

ChatGPT出医疗专用版,临床医生可以免费用AI辅助诊疗了。

  1. Claude 桌面版官方支持第三方 API,中转站用户受益 --- Claude 桌面应用现在可以配置第三方 API, 🔗

Claude 桌面版终于原生支持第三方 API,绕过官方账号直接调用,中转站用户可以光明正大用了。

  1. HeyGen HyperFrames 支持拖拽预览直接编辑时间线 --- HeyGen 旗下的 HyperFrames 新增时间线直接编辑功能, 🔗

HeyGen 视频编辑加了拖拽预览直接改时间线的功能,补齐了之前 AI 视频工具的一个短板。

  1. OpenAI Workspace Agents:GPTs升级到agent时代 --- OpenAI正式推出Workspace Agents, 🔗

GPTs升级成能自动执行任务的agent,云端运行,直接集成Slack等办公平台。

  1. Google推出Gemini企业代理平台 --- Google DeepMind联合Google Cloud发布了Gem... 🔗

Google的企业agent平台来了,从Vertex AI升级,支持模型选择和安全集成。

研究论文

  1. 索尼发布乒乓球机器人Ace:强化学习落地机器人 --- 索尼在Nature发表论文,展示了名为Ace的自主乒乓球机器人。 🔗

索尼机器人打乒乓球达到专家水平,RL在实体任务落地了。

  1. Google DeepMind 发布 Vision Banana 论文:图像生成器是通用视觉学习者 --- Google DeepMind 团队发表论文, 🔗

Google DeepMind 发了篇论文,证明图像生成模型本质上也是视觉学习器,一鱼两吃那种。

  1. Poly-EPO:解决RL微调导致LLM输出趋同问题 --- 强化学习微调容易让LLM的输出熵过早崩溃------模型变得只会重复正确答案, 🔗

RL微调容易让模型输出变得死板,Poly-EPO用set-RL保持多样性的同时确保正确性。

  1. TACO框架:让长周期agent自己学会压缩上下文 --- TACO是一个自进化框架, 🔗

长周期任务agent容易在上下文里迷失,TACO让agent自己学会压缩上下文,wrapper形式直接可用。

  1. GiantsBench:测试LLM能否产生新科学洞见 --- GiantsBench是一个新的科学发现基准测试, 🔗

行业动态

  1. Anthropic产品口碑下滑遭质疑 --- 多位AI从业者指出Anthropic产品力下降且缺乏透明沟通。 🔗

Claude系列被质疑不行了,Anthropic沉默应对引发社区不满。

  1. Seedance 2.0 推出优惠套餐,每秒 720p 仅 0.1 美元 --- Seedance 2.0 视频生成模型推出更实惠的套餐计划, 🔗

Seedance 2.0 降价抢市场,和 GPT Image 2.0 组合使用是目前成本最低的 AI 视频方案之一。

  1. Claude Code获Webby奖,AI编程工具获认可 --- Anthropic的AI编程工具Claude Code获得了Webby... 🔗

Claude Code拿奖了,AI编程工具进入主流奖项视野。

  1. F Chollet:评估AGI不该看模仿能力 --- Keras作者F Chollet发推指出, 🔗

F Chollet认为用模仿人类来定义AGI是个错误,智能应该体现在学会未知任务的能力上。

  1. Yann LeCun:AI行业陷入LLM路径依赖 --- Yann LeCun转发了别人对他的引用, 🔗

LeCun提醒行业都在跟风LLM,多元化探索不足。


关注我,每天获取AI最新资讯。

相关推荐
共享家9527几秒前
OpenClaw的通道配置
人工智能·学习·openclaw
Omics Pro4 分钟前
「自兹以往」动物肠道微生物组
数据库·人工智能·机器学习·语言模型·自然语言处理
oddsand111 分钟前
pgvector 三大相似度算法
人工智能·算法·机器学习
2601_9557819812 分钟前
私有化本地 AI,Windows 平台 OpenClaw 功能详解与配置
人工智能·开源·github·open claw
红色星际13 分钟前
Momenta赴美招揽AI人才
人工智能
贺国亚14 分钟前
Spring-AI与LangChain4j
java·人工智能·spring
沫儿笙14 分钟前
发那科机器人氩弧焊节气装置
人工智能·机器人
Cloud_Shy61815 分钟前
解读《Effective Python 3rd Edition》:从练气到老魔(第三章 Item 21 - 24)
开发语言·人工智能·笔记·python·迭代器模式
拾年27518 分钟前
别调 BERT 了:我用 Prompt 做了套 NLP 系统,20 分钟搞定
前端·人工智能
装不满的克莱因瓶40 分钟前
学习 LLM 的函数回调及格式化输出,让 LLM 拥有更强的能力
人工智能·ai·大模型·llm·agent·智能体