47-260429 AI 科技日报 (HappyHorse 1.0 登顶文本转视频模型排行榜)

47-260429 AI 科技日报 (HappyHorse 1.0 登顶文本转视频模型排行榜)

共收录 22 条资讯

AI模型

  1. Bubeck:OpenAI内部代理已在纠正论文错误 --- OpenAI研究员Sébastien Bubeck在播客中透露, 🔗

内部代理不只是回答问题,还会主动发现新研究方向、纠正已发表论文的错误------也许1-2年内就能承担人类研究员的大量工作。

  1. HappyHorse 1.0 登顶文本转视频模型排行榜 --- HappyHorse 1.0 在 Artificial Analysi... 🔗

HappyHorse 1.0 现在是文本转视频赛道的第一名。

  1. NVIDIA Nemotron 3 Nano Omni开源发布 --- NVIDIA发布Nemotron 3 Nano Omni, 🔗

开源多模态模型又添新成员,NVIDIA直接开源30B参数的多模态模型,支持音视频图,256K上下文。对于想在本地跑多模态推理的开发者来说是好事。

  1. 商汤开源SenseNova U1:原生理解生成统一模型 --- 商汤开源日日新系列原生理解生成统一模型SenseNova U1, 🔗

国内首个原生理解生成统一模型开源,架构思路对标Gemini,部署门槛不高。

  1. 蚂蚁百灵开源高效Instruct模型Ling-2.6-flash --- 蚂蚁百灵团队开源了Ling-2.6-flash, 🔗

26B参数的高效Instruct模型,Flash版针对推理速度优化,开源训练细节。

产品发布

  1. Codex支持一键升级旧项目到GPT-5.5 --- OpenAI开发者账号宣布, 🔗

Codex新增功能:直接让GPT-5.5升级旧代码库,自动化模型迁移。

  1. Devin for Terminal:Cognition重新定义终端 --- Cognition宣布推出Devin for Terminal, 🔗

Cognition把Devin塞进终端,AI编程从网页/IDE延伸到命令行界面。

  1. Claude 新增 Blender 集成,AI 直接操控 3D 场景 --- Claude 推出了 Blender 连接器, 🔗

用 Claude 直接改 Blender 场景,批量操作不用手动来了。

  1. Gemma 4 本地浏览器 AI 代理开放 --- Google Gemma 团队推出完全运行在浏览器本地的 AI 代理, 🔗

浏览器里跑本地 AI 代理,隐私数据不用上传了。

  1. GitHub Copilot 6月起全面转向按量计费 --- GitHub Copilot将从固定额度订阅制改为按量计费, 🔗

Copilot改用按量计费,轻度用户可能省钱,重度用户成本会上涨。

研究论文

  1. LoRA新用法:检测你的模型被微调做了什么 --- 有人研究出一种LoRA技巧, 🔗

往任何微调过的模型加个LoRA,它就能分析出这个模型被训练来干什么------相当于逆向推断训练目标。

  1. Qwen3-Coder后训练debug:修复率从70%升到89% --- 有开发者分享了Qwen3-Coder的后训练成果:用真实调试器训练模型... 🔗

给Qwen3-Coder挂个真实调试器训练,bug修复率从70%跳到89%,中位数缩短到46轮。

  1. Large Memory Model新架构概念 --- 有人提出LMM(大型记忆模型)这个新概念。 🔗

不压缩世界知识,而是记住你的个人上下文,在合适时机自动提取。这个思路和人脑记忆机制更像。

  1. 阿里通义推出全新强化学习框架EAPO --- 阿里通义实验室发布了强化学习框架EAPO(Evolutionary A... 🔗

通义实验室的新RL框架,针对大模型RLHF的效率和稳定性问题提出改进方案。

工具推荐

  1. 不到10美元/小时训练20B MoE,8台机器搞定 --- 一位开发者在推特分享了用廉价GPU集群预训练20B MoE模型的方法。 🔗

用散装GPU集群(主要是L40S)训练20B MoE,每小时成本不到10美元,门槛在持续降低。

  1. 自然语言自动设计 PCB 电路板工具发布 --- 一款基于自然语言的 KiCAD PCB 设计自动化工具发布, 🔗

用说话的方式设计电路板,KiCAD 现在能用自然语言驱动了。

  1. LLM-as-Judge评估实战方案 --- 有人分享了用LLM当评判模型的经验。 🔗

LLM-as-Judge确实有用,但选对评判模型很关键。推荐先用便宜模型粗筛,再用强模型精评,能省不少钱。

  1. Andrew Ng发布全民AI提示工程课 --- Andrew Ng在DeepLearningAI上线了一门叫「AI P... 🔗

Andrew Ng出了门prompting课,核心是教你更有效地跟AI沟通。适合所有用AI工具但感觉效果不达预期的人。

行业动态

  1. Periodic用RL缩放科学研究:数据成了新瓶颈 --- AI公司Periodic分享经验:在搭建第一个实验室后, 🔗

他们把RL scaling应用到真实科学实验后发现,瓶颈从算力转移到了数据理解和分析上。

  1. Vercel Labs 招聘 AI 时代开发者工具团队 --- Vercel 正在扩充 Vercel Labs 团队, 🔗

以前做的是给人用的工具,现在要给 AI agent 做工具了。

  1. 开源机器人Reach Mini发货进展 --- 开源机器人Reach Mini正在批量出货, 🔗

开源机器人Reach Mini持续出货,批量已达数千台。软硬件都开源,降低了机器人开发的门槛。

  1. OpenAI和微软联合宣布云合作独家限制正式解除 --- OpenAI和微软宣布此前签署的云合作独家限制条款正式解除。 🔗

微软和OpenAI的独家云合作限制解除,Azure的特殊地位可能受影响。


关注我,每天获取AI最新资讯。

相关推荐
@不误正业1 小时前
鸿蒙小艺智能体开放平台实战-接入系统级AI-Agent能力
人工智能·华为·harmonyos
byoass1 小时前
智巢AI知识库深度解析:企业文档管理从大海捞针到精准狙击的进化之路
开发语言·网络·人工智能·安全·c#·云计算
掘金一周1 小时前
你们觉得房贷多少,没有压力 | 沸点周刊 4.30
前端·人工智能·后端
美狐美颜SDK开放平台1 小时前
多场景美颜SDK解决方案:直播APP(iOS/安卓)开发接入详解
android·人工智能·ios·音视频·美颜sdk·第三方美颜sdk·短视频美颜sdk
桜吹雪2 小时前
Langchain.js官方文档:构建具备按需加载技能的 SQL 助手
javascript·人工智能·node.js
ting94520002 小时前
深入解析 Social Fetch 机制:原理、架构、应用场景、实战落地与性能优化全攻略
人工智能·性能优化·架构
阿瑞说项目管理2 小时前
2026 实战入门指南:企业 Agent 到底能解决哪些工作问题?
大数据·人工智能·agent·智能体·企业级ai
ZOOOOOOU2 小时前
云边端协同架构下,门禁权限引擎的离线决策与策略续存实现
大数据·人工智能·架构
han_2 小时前
一篇看懂国内外主流大模型:GPT、Claude、Gemini、DeepSeek、通义千问有什么区别?
前端·人工智能·llm