苹果Ferret-Pro首次应用于汽车场景,CarPlay 3.0展示本地AI能力|小亦之闻|AI 编程三日速递!(6月28日~6月30日)

介绍:

#AI及人工智能方面🖥️(6月28日~6月30日)

28日:

1、 苹果Ferret-Pro SDK下载量突破300万,首批第三方应用涌现

苹果自研端侧大模型Ferret-Pro的开发者SDK下载量在今日突破300万次。知名设计软件、写作辅助工具及教育类App已相继发布集成Ferret-Pro的测试版本,利用其本地推理能力提供智能修图、实时文风润色与口语陪练功能,所有处理均在设备端完成。

2、谷歌Gemini 3.5 Pro登陆Google Cloud,向开发者提供免费额度

谷歌宣布Gemini 3.5 Pro已在Google Cloud全面可用,并向每位开发者提供每月一定额度的免费API调用。凭借其突出的编程能力与极低的推理成本,已有数十家初创企业表示将把AI助手后端从其他模型迁移至此。

3、特斯拉发布Optimus Gen 3自主充电演示,展示完整离线工作流

特斯拉通过官方渠道发布了Optimus Gen 3人形机器人的最新演示视频。在未连接网络的状态下,机器人自主完成了从识别低电量状态、导航至充电站到插拔充电枪的全过程,全程依赖其端侧多模态大模型进行视觉识别与运动规划。

1、CVPR 2026圆满闭幕:动态3D场景重建获最佳学生论文

计算机视觉顶会CVPR 2026于今日闭幕,最佳学生论文授予了苏黎世联邦理工学院关于"单目视频到可编辑动态3D场景"的研究。该工作能让用户像编辑文档一样,通过拖拽等操作直接改变视频中物体的运动轨迹和三维形状,在影视创作和机器人仿真领域具有巨大潜力。

2、 斯坦福大学发布医疗多模态模型Med-PaLM 3,临床对话能力媲美全科医生

斯坦福大学与多家医学中心联合发布了多模态医疗大模型Med-PaLM 3。该模型不仅能解读CT、MRI等影像,还能结合电子病历进行多轮问诊对话。在双盲评估中,其在常见病诊断准确率和患者沟通质量上均与有五年经验的全科医生相当。

29日:

4、 苹果Ferret-Pro首次应用于汽车场景,CarPlay 3.0展示本地AI能力

苹果宣布新一代CarPlay 3.0将深度集成Ferret-Pro端侧大模型,可在不联网的情况下为驾驶员提供实时路况分析、语音助手语义理解及车内场景感知。首批合作车企包括宝马、奔驰和福特,预计2027年款车型将开始预装。

5、Meta开源多模态模型Llama 4-Vision下载量一周破千万

Meta发布的开源多模态视觉模型Llama 4-Vision热度持续攀升,在Hugging Face上的累计下载量仅一周即突破1000万次,成为目前增长最快的开源多模态模型。社区已衍生出多个专注于医学影像识别、遥感分析和工业质检的微调版本。

6、麻省总医院与哈佛医学院用AI筛选出新型广谱抗生素候选物

通过基于图神经网络的分子生成模型,麻省总医院与哈佛医学院的联合团队从数百万虚拟分子中筛选出两种具有全新机制的广谱抗生素候选物,对世界卫生组织列出的多种耐药菌表现出强效活性。研究同步发表于《细胞》,并已启动临床前毒理学评估。

7、 苏黎世联邦理工学院推出通用3D场景理解模型

继在CVPR 2026获得最佳学生论文后,苏黎世联邦理工学院开源了其核心模型架构SceneForge。该模型可从任意单张图片重建包含物理交互的动态3D场景,并支持用户用自然语言对场景中的物体进行增删和变形操作,为游戏开发和虚拟制作提供了新工具。

8、谷歌DeepMind发布"AI for Science"年度进展报告

DeepMind发布了年度"AI for Science"报告,重点总结了近期AI在生物学、材料科学、数学和气候建模等领域的突破。其中特别提到,AI辅助的蛋白质设计已被用于开发针对寨卡病毒的新型疫苗候选分子,并在动物实验中展现出强效保护作用。

30日:

9、 OpenAI IPO最终定价每股95美元,零售认购明日开启

OpenAI宣布IPO最终定价为每股95美元(定价区间上限),对应市值约1.15万亿美元。面向个人投资者的申购通道将于7月1日零点(美东时间)正式开启。截至目前,各合作券商累计收到零售认购预约已突破1200万,预计将成为史上散户参与规模最大的科技IPO。同时,OpenAI公布了GPT-6的部分训练指标,代码生成能力较GPT-5.5提升约40%,数学推理提升约35%。

10、 英伟达Blackwell Ultra正式开始全球发货

英伟达宣布Blackwell Ultra GPU于今日起正式向全球客户发货。首批交付对象为微软Azure、谷歌云、Oracle和DeepSeek等核心合作伙伴。该GPU在万亿参数模型推理场景下,能效比较上一代H200提升约4倍,预计将显著推动大模型API成本的进一步下降。

11、 苹果Ferret-Pro将登陆Vision Pro,打造空间AI体验

苹果宣布自研端侧大模型Ferret-Pro将于今秋通过系统更新登陆Apple Vision Pro。用户可在混合现实中通过语音和手势与空间AI助手交互,完成3D模型生成、实时环境理解及多模态笔记等任务,所有处理均在设备端完成,保持苹果一贯的隐私标准。

12、 ICML 2026完整议程公布,世界模型与多Agent协作成核心主题

第43届国际机器学习大会公布了完整议程。本届大会录用论文中,"世界模型与物理推理"、"多Agent自组织协作"和"联邦学习隐私理论"成为三大最热主题。多篇来自清华大学、MIT及DeepMind的论文被选为口头报告。

13、 谷歌发布Med-Gemini医疗大模型,在医生执照考试中得分超95%

谷歌基于Gemini 3.5 Pro发布医疗领域微调版本Med-Gemini,在美国医师资格考试综合评测中正确率超过95%。该模型可同时解读医学影像、基因组数据与电子病历文本,并提供带引用来源的诊断建议,已在数家医院进入临床验证阶段。

14、清华团队提出"认知地图"机制,大模型长程规划能力大幅提升

清华大学研究团队在《自然·机器智能》发表论文,提出受神经科学启发的"认知地图"机制,让大模型在复杂规划任务中自主构建环境的空间与逻辑表征。在长程导航和项目规划基准上,该方法使任务完成率较基线模型提升超过25个百分点。

##编程💻(6月28日~6月30日)

28日:

1、 Red Hat发布OpenShift AI 3.0,全面支持多Agent编排

Red Hat在开源峰会上发布了OpenShift AI 3.0平台。该版本新增了对多AI代理协作的图形化编排功能,并内置了对模型偏见检测与可解释性工具的支持,旨在帮助企业更可靠地在混合云环境中部署生成式AI应用。

2、Node.js 24发布,原生支持WebAssembly系统接口

Node.js 24正式版发布,最大的技术亮点是原生集成了WASI(WebAssembly系统接口)的完整支持,使得开发者可以直接在Node.js应用中运行编译为Wasm的高性能模块,为在服务端无服务器环境中运行轻量级AI推理模型打开了大门。

29日:

3、JetBrains AI助手2.0首周下载量翻倍,多模型切换受热捧

JetBrains AI Assistant 2.0发布一周后,下载量较1.0版本同期增长120%。开发者反馈最积极的功能是"按任务选模型"------代码生成用Claude、重构用DeepSeek、文档注释用GPT-5.5,灵活控制成本与质量。JetBrains宣布将加速开发基于项目上下文自动推荐最佳模型的功能。

4. 开源操作系统OpenHarmony 6.0发布,AI框架全面升级

开源操作系统OpenHarmony 6.0版本正式发布,其内置的AI子系统新增了对端侧大模型(含Ferret-Pro和Lance 3B)的标准化适配,并提供统一的分布式AI推理接口。开发者只需编写一次代码,即可在手机、平板、车机等多种设备上运行AI推理任务。

5、Bun 2.0发布,实现JavaScript运行时与边缘AI推理的深度整合

JavaScript运行时Bun发布了2.0正式版,最大的变化是深度集成了WASI-NNx,开发者可以直接在Bun应用中导入并运行基于WebAssembly的AI模型。官方演示显示,在边缘环境中启动一个Whisper语音识别服务仅需不到5毫秒的冷启动时间,使其成为轻量级AI应用的强力竞争者。

30日:

6、 2026年6月TIOBE编程语言排行榜:Rust份额升至1.9%新高

TIOBE 6月最终榜单显示,Python以19.56%居首;Rust份额升至1.90%,稳居第9位,并进一步扩大与第10位语言的差距。TypeScript以4.22%位居第7,Swift因苹果端侧AI生态的拉动,以1.45%升至第12位。TIOBE CEO评论称,内存安全正成为新一代系统编程的核心驱动力。

7、 Rust Candle 2.0 Beta版发布,计算性能大幅跃升

在Rust基金会资助下,高性能张量库Candle 2.0 Beta版正式发布。新版本引入了自动算子融合、Blackwell Ultra初步支持以及与PyTorch模型的权重互转功能。在多项推理基准上,Candle 2.0的性能已追平LibTorch的85%以上,且内存占用仅为其一半。

8、OpenHarmony 6.0开发者工具包上线,主打一次开发多设备部署

开源操作系统OpenHarmony 6.0的配套开发者工具包正式上线。工具包内置了统一的分布式AI推理接口和可视化调试工具,开发者只需编写一次AI推理代码,即可在手机、平板、车机和IoT设备上运行,极大降低了多端AI部署的复杂度。

--- 感谢观看---

制作:Code.小亦
查找来源:新浪财经、今日头条、搜狐、deepseek-ai、新华社、网易新闻、大数据结合。

初审:Code.小亦。

终审:Code.小亦。

本文章属于原创作品,禁止任何人进行转载,除合作之外!!

如在阅读中发现知识性错误、代码错误、错别字错误等情况私信博主或评论或通过邮箱2952104443@qq.com。