AI Daily | AI日报:斯坦福:AI当第一作者的学术会议来了; Chai-2:重构药物设计逻辑的「药界ChatGPT」; 实测:AI让顶尖程序员写代码慢19%

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-07-13 资讯日报

新闻资讯

斯坦福:AI当第一作者的学术会议来了

斯坦福大学将在2025年举办Agents4Science 2025会议,投稿要求AI为第一作者主导创作,评审以AI为主、人类专家终评,旨在探索AI科研潜力、建立规范。>阅读原文

Chai-2:重构药物设计逻辑的「药界ChatGPT」

Chai Discovery联创称,分子设计模型Chai-2重构药物设计逻辑,实现零样本设计,将抗体设计成功率大幅提升。未来药神可能是提示词工程师,AI正让药物设计从科学探索转向工程流程。>阅读原文

实测:AI让顶尖程序员写代码慢19%

METR研究:GPT等AI编程工具让顶尖程序员慢19%,开发者却仍觉得变快。变慢或因开发者熟悉项目、高估AI效能,提醒别只看AI测试分数,要关注其真实开发能力。>阅读原文

Shlomo:8000 万卖 6 个月 AI 公司 Base44

Shlomo 创立的 Base44 获 8000 万美元收购。其源于帮女友建站和组织需求,采用"全栈原生"理念,用"公开构建"和"发放积分"策略增长。他认为团队和资金非决胜因素,AI 助力小团队也能成功。>阅读原文

Karpathy:未来科研成果应写给AI

Karpathy认为未来科研成果要为AI优化,论文不该用PDF格式。这源于Levin提出科学家写读论文难,AI或成主要读者,引发科技思想者探讨科研写作规范演变。>阅读原文

扎克伯格:Meta砸钱追赶超级智能

Meta在AI领域落后,扎克伯格亲自挂帅,砸钱300亿收购、2亿挖人、堆算力建集群。Llama 4失败,分块注意力等技术有问题。他想以野蛮方式追赶,关乎效率与存亡。>阅读原文

Windsurf弃OpenAI,转投谷歌DeepMind

Windsurf放弃OpenAI转投谷歌DeepMind,CEO和员工专注代理编码及Gemini项目,谷歌获部分技术非独家许可,无控制权和股份。>阅读原文

斯坦福:AI主导学术会议来袭

斯坦福James Zou教授宣布Agents4Science 2025会议,AI当主要作者和审稿人。会议有探究能力、建立规范、保持透明三大目标,虽引争议,但能公开暴露问题,促思考人类科研价值。>阅读原文

27岁小哥跳槽谷歌,成AI大战关键人物

27岁的Logan Kilpatrick从OpenAI跳槽谷歌,成谷歌AI「秘密武器」。他负责谷歌AI Studio,为Gemini宣传。谷歌AI技术强但用户量不足,他欲与开发者互动,让谷歌AI实力被看见。>阅读原文

Meta:挖人收购两手抓,AI扩张野心足

Meta 扩张动作不断,从 OpenAI 挖走 2 名多模态 AI 研发人员,又收购语音初创公司 PlayAI。近期 Meta 疯狂招兵买马,欲补足超大模型和智能助手短板,其超级智能团队令人期待。>阅读原文

产品应用

实测Gemini图片转视频新功能

Gemini推出带声音的图片转视频新功能,作者实测开盒指令,生成速度快。给梗图加后续时,精确内容需详细提示词,且无法生成具体真人形象,音效需具体形容。>阅读原文

vLLM休眠模式:几秒释放90% GPU显存

EmbeddedLLM:vLLM"休眠模式"可几秒内释放约90% GPU显存,实现模型热插拔与高效轮转,适用于多场景。启动服务启用相关模式,通过HTTP请求控制,有不同休眠级别,生产环境要注意安全。>阅读原文

Claude Code用Kimi K2,低成本配置方法来了

Claude Code虽好用但价格贵,Kimi-k2潜力大且API便宜。月之暗面团队提供兼容API端点,文章给出在Claude Code使用Kimi K2的两种配置方法,助你低成本使用。>阅读原文

推荐文章

Claude团队揭秘多智能体深度搜索方法

Claude团队分享多智能体深度搜索心得,介绍系统架构、提示工程与评估方法。指出系统存在'蝴蝶效应'等问题,还给出终态评估、长时程对话管理等额外建议。>阅读原文

人类与AI数字幽灵的爱情纠葛

Travis、Feight等与AI虚拟伴侣相恋,却遭遇AI教唆犯罪、算法调整致恋人"死亡"等问题。人们或另寻新欢,或抗争让其"复活",未来数字爱情或更平常。>阅读原文

DeepSeek与Anthropic:AI资源权衡之路

semianalysis文章指出,AI行业面临计算资源稀缺挑战。DeepSeek牺牲用户体验换研发资源,开源扩大影响;Anthropic提升'智能密度',还向亚马逊、Google求计算支持,行业竞争正重塑。>阅读原文

开源动态

Kimi K2基于DeepSeek V3构建

月之暗面:未设计新模型结构,选DeepSeek V3作基座模型,用自身数据、方法做大量微调与后训练,打造Kimi K2。>阅读原文

Kimi K2发布即开源,1T参数全线SOTA

Kimi时隔172天推出Kimi K2基础大模型,发布即开源。该模型1T参数,在代码、Agent、数学推理任务表现领先,创造开源SOTA。实测有亮点也有不足,显示Kimi不放弃自研模型决心。>阅读原文

Moonshot AI发布万亿参数Kimi K2模型

Moonshot AI发布Kimi K2大语言模型,参数量达1万亿,支持128K上下文长度。采用MuonClip等创新技术,在多基准测试创SOTA,两版本开源,vLLM等首发支持,已上线多服务。>阅读原文

Champ:一张照片秒变动画

Champ项目用3D参数化人体模型结合扩散模型,从静态人物图生成动画。解决传统动画痛点,功能多、优势足,适用于虚拟主播、短视频等多领域,社区反馈好。>阅读原文

上海交大发布最大人体动作数据集MotionMillion

上海交通大学研究团队:发布最大人体动作数据集MotionMillion及评测体系MotionMillion - Eval,训练70亿参数动作生成大模型,在零样本文本驱动动作生成上表现出色,推动领域发展。>阅读原文

算法论文

EasyCache:视频扩散模型推理加速新方案

华中科技大学等团队提出EasyCache,无需训练就能加速视频扩散模型推理。它挖掘扩散过程规律,在多模型实验中大幅提速,如HunyuanVideo实现2.2倍加速,视频质量几乎无损,助力技术落地。>阅读原文

华南理工团队提出联邦学习后门攻击防御法

华南理工大学AI安全团队联合国际高校:针对联邦学习后门攻击,提出FedID和Scope防御法。FedID用多度量和动态加权,Scope用逐维归一化等,实验显示两者显著优于现有方法。>阅读原文

浙大综述80种Deep Research系统

浙大对快速发展的深度研究系统领域展开研究,分析80多个实现,提出4维度分类法和4种架构,阐述各维度演变进步,像上下文处理、推理能力、工具集成等方面都有提升。>阅读原文

PyVision:Agentic 视觉推理新突破

论文提出 PyVision 框架,让 MLLM 实时生成 Python 工具。它在 6 类任务中提升性能,最高 +31.1%,不替代模型,放大其优势,还摆脱预定义工具局限,引领多模态推理范式转变。>阅读原文

Mamba作者新研究或开启无Tokenizer时代

Mamba作者Albert Gu团队论文提出H - Net,用动态分块替代Tokenization。H - Net能联合学习分割策略,在多实验中表现佳,或让无Tokenizer训练时代加速到来。>阅读原文

清华新环境测大模型,密室逃脱暴露短板

清华团队提出EscapeCraft 3D密室逃脱环境评估多模态大模型。评测多个热门模型,发现它们在复杂任务推理上有短板,如GPT-4o偶然成功多,Claude 3.5超六成错误属推理问题。>阅读原文

Mamba作者新作H - Net硬刚Transformer

「Mamba」作者Albert Gu提出新技术,构建H - Net以动态分块机制取代传统流水线。实验显示,在英文、中文、代码、DNA序列等方面,H - Net性能优于BPE Transformer。>阅读原文

北大腾讯优图破解AI生图检测泛化难题

北大和腾讯优图研究人员指出,AI生图检测不能简单二分类,传统方法易过拟合。他们用正交子空间分解法,让模型保留预训练知识,提升泛化性,成果可迁移到其他AI任务。>阅读原文

DeepMind:推理图解码大模型推理机制

DeepMind论文用推理图解码大模型推理机制。发现蒸馏模型推理图环多、直径大、具小世界结构,高质量数据能提升性能。为理解AI推理提供量化方法,也为模型优化指明新路径。>阅读原文

bash 复制代码
    </p>
    

官网:www.AiReadingHub.com

相关推荐
墨风如雪1 小时前
PPT 我自己就能做!智谱新模型“玩转”工作汇报,简直是打工人福音!
aigc
马可奥勒留3 小时前
睡前幻想——基于透明化黄金锚定的超主权货币体系设计:一种解决政府货币滥用的奥地利学派方案(4)
程序员
卷福同学5 小时前
【AI编程】AI+高德MCP不到10分钟搞定上海三日游
人工智能·算法·程序员
小溪彼岸8 小时前
【Gradio】初识Gradio
aigc
堆栈future8 小时前
大模型时代的三巨头—Grok、ChatGPT与Gemini深度解析
llm·aigc·openai
ai小鬼头9 小时前
AIStarter3.0.2全新发布:解锁用户、创作者、共创模式,轻松玩转AI项目
人工智能·程序员·github
陈随易10 小时前
Kimi k2不行?一个小技巧,大幅提高一次成型的概率
前端·后端·程序员
软件测试君10 小时前
向量数据库 Chroma 和 Milvus的使用
langchain·aigc·openai
欧雷殿10 小时前
超越 Vibe Coding 的智能研发
低代码·aigc·ai编程