62-260515 AI 科技日报 (Qwen3.6 模型推理速度再提升,MTP加速至1.8倍)

62-260515 AI 科技日报 (Qwen3.6 模型推理速度再提升,MTP加速至1.8倍)

共收录 21 条资讯

AI模型

  1. Qwen3.6 MTP推理加速至1.8倍,新GGUF发布 --- 在llama.cpp中,Qwen3.6 MTP GGUF模型通过优化新参数--spec-draft-p-min,推理速度提升了1.8倍。 🔗
  2. ChatGPT免费用户暂别GPT-5.5 --- ChatGPT免费版用户现在只能使用GPT-5.4模型,暂时无法访问最新的GPT-5.5。 🔗
  3. 小米开源自动驾驶大模型Xiaomi OneVL --- 小米具身智能团队开源了多模态视觉语言模型Xiaomi OneVL,专为自动驾驶场景中的感知与决策任务设计。 🔗

产品发布

  1. 谷歌Gemini Spark新截图曝光 --- 从泄露的截图看,谷歌Gemini Spark将主打高级工具使用和技能创建能力,但目前版本尚不支持浏览器控制。 🔗
  2. Codex新功能:Mac锁屏后任务继续跑 --- OpenAI Codex正在测试一个新特性,允许在Mac电脑锁屏后,正在运行的任务不受影响。 🔗
  3. Codex登陆手机ChatGPT,免费开放 --- OpenAI编程助手Codex集成到ChatGPT移动端,向所有用户免费开放,支持远程对桌面端对话发送指令和查看进度。 🔗
  4. 阿里云发布Qoder 1.0智能体工作台 --- 阿里云推出Qoder 1.0,将其定位从AI IDE升级为智能体自主开发工作台,采用Agent-first设计,并内置了团队级知识引擎。 🔗
  5. Runway推出视频创作智能体Runway Agent --- Runway发布了能够理解复杂创意描述、并自主规划和执行视频生成任务的AI智能体Runway Agent。 🔗

研究论文

  1. 新范式:让LLM学会"自我教学" --- 研究提出Pedagogical RL,其核心是让大语言模型先学习正确答案的分布规律,再从中采样,而非单纯通过尝试和错误来学习。 🔗
  2. 一篇关于Agentic AI通往AGI的立场论文 --- 一篇新的立场论文探讨了将AI代理(Agentic AI)作为实现通用人工智能(AGI)的一条可行路径。 🔗
  3. 大模型内部的"形状旋转计算器" --- 研究发现,大语言模型内部可能隐藏着一种通过"旋转形状"来执行数学计算的机制。 🔗

工具推荐

  1. OpenClaw新版本:TS安全库速度飙升 --- OpenClaw新版TypeScript安全文件系统库将文件操作速度提升10倍,整体性能提升3.5倍。 🔗
  2. MCP服务器选对了,能省30%的token --- 基准测试表明,在Claude中选用合适的MCP服务器,可以减少高达30%的token消耗并提高任务成功率。 🔗
  3. 开源Skill:AI自动撰写软著申请材料 --- 一个开源工具能够读取本地代码项目,自动生成软件著作权申请所需的操作手册和代码材料。 🔗
  4. 实时Qwen3-TTS,无需vLLM或Triton --- 不依赖vLLM或Triton,即可实现Qwen3-TTS实时语音合成的方法。 🔗
  5. 月之暗面推出Kimi WebBridge浏览器插件 --- 月之暗面发布Kimi WebBridge插件,利用AI自动执行登录、点击、填表等浏览器操作,实现网页任务自动化。 🔗

行业动态

  1. DeepSeek-V4技术报告工程细节视频流出 --- 一份视频分享了DeepSeek-V4技术报告中的部分工程优化细节和模型训练实践技巧。 🔗
  2. 新概念:Agent体验(AX) --- 开发者提出AX(Agent体验)概念,旨在衡量代码库对AI代理的友好程度与可操作性。 🔗
  3. Yann LeCun:开源是AI的未来 --- Yann LeCun转发并强烈支持一篇倡导开源AI的文章,认为反对开源的论点本身是有问题的。 🔗
  4. 《华盛顿邮报》披露AI公司的"秘密指令" --- 《华盛顿邮报》报道揭示了部分AI公司用于引导其聊天机器人行为的内部指令。 🔗
  5. 科学家在《纽约时报》呼吁加强AI监管 --- 来自MIT等机构的科学家在《纽约时报》联合发文,呼吁对AI技术实施更强有力的监督与监管。 🔗

一起学习AI。

相关推荐
voidmort几秒前
13. 强化学习中的评估、奖励设计与 Reward Hacking
人工智能
Studying 开龙wu1 分钟前
16位工业灰度图的深度学习预处理:从方法选择到ImageJ实战
人工智能·深度学习
烟雨江南7855 分钟前
特高压输电线路带电作业直升机吊篮与强电磁感应放电:基于“灵声智库”空间自适应滤波与声纹授权的离线语音控制指令方案
人工智能·ffmpeg·webrtc·语音识别·ai质检
清辞8537 分钟前
入门大模型工程师第十课----学习总结
大数据·人工智能·深度学习·学习·语言模型
zhangfeng11337 分钟前
那nvidia orim车载gpu tee安全飞地 和天垓 100 gpgpu的 飞地 ,大概有多大存储量 ,解密流程
人工智能·深度学习·安全·语言模型·gpu算力·芯片
蔡不菜和他的uU们21 分钟前
vLLM实践之个人AI基建——云端vLLM+SSH Tunnel+本地Cherry Studio
人工智能·ssh·vllm
黄啊码26 分钟前
8个AI,同一道高考作文题,同一个结果:我的那篇最好
人工智能
m0_7372469827 分钟前
QDKT产品拆解&设计
人工智能
xinlianyq30 分钟前
TikTok短视频生成工具哪家好?跨境出海如何用 AI 实现爆款视频复刻
人工智能·aigc
源码宝38 分钟前
基于SpringCloud+UniApp的智慧工地云平台整体架构设计与实现
java·人工智能·spring cloud·源码·智慧工地·云平台