Google 推出 Gemini 1.5 Pro能处理音频;iOS 18或带来Safari 浏览助手;Llama 3 开源模型下个月推出

Google 推出 Gemini 1.5 Pro 公共预览版,能处理音频

Google 宣布将通过其 AI 应用平台 Vertex AI 向公众提供 Gemini 1.5 Pro,并且还赋予其「听力」,帮助用户处理音频内容。

用户可以上传会议录音、电视节目等音频内容,无需书面记录就可让其解读和总结。

Gemini 1.5 Pro 于 2 月份发布,当时面向开发者和企业用户开放。

据悉,这个在 Gemini 系列中定位中量级的模型,在性能上已经超越了体型和性能最强的模型 Gemini Ultra。

除此之外,Google 还发布了首款 Arm AI 处理器 Axion,Google 表示,Axion 处理器比同类基于 X86 的产品高出 50% 的性能和 60% 的能效,比 AWS 和微软等竞争对手基于 Arm 的产品性能高出 30% 。

Google 还推出了一个新的视频生产力工具「Vids」。据 Google 介绍,用户只要会制作 PPT,就可以在 Vids 中制作视频。

iOS 18 或带来「Safari 浏览助手」

MacRumors 报道,有开发者发现苹果服务器后台代码,显示 iOS 18 将配备一个新的「Safari 浏览助手」。

代码显示了关于「Safari browsing assistant」(Safari 浏览助手)的字符描述,该开发者推测,这个浏览助手可能会类似微软的 Copilot ,能够总结当前网页的主要内容。

这个 Safari 浏览助手可能是 iOS 18 新的生成式 AI 功能之一。目前 iPhone 上一些第三方浏览器已经配备了类似的功能,比如说微软浏览器 Edge 上的 Copilot ,和 Arc Search。

路透社近日报道,在欧盟开放 iOS 第三方默认浏览器选择后,欧盟用户更愿意使用其他浏览器来替代 Safari。

Meta 确认其 Llama 3 开源模型下个月推出

Meta 在伦敦的一场活动上确认会在下个月发布 Llama 3 大语言模型。

Meta 全球事务总裁 Nick Clegg 同时表示称,Llama 3 将为 Meta 多种产品提供支持,今年还将推出许多具有不同功能、不同通用性的模型。

The Information 此前报道,Meta 将在下周推出小型的、非多模态的 Llama 3 版本,而将在今年夏季推出大型的、多模态的 Llama 3。

相关推荐
丝斯20111 分钟前
AI学习笔记整理(20)—— AI核心技术(深度学习4)
人工智能·笔记·学习
love530love1 分钟前
【笔记】重建 Stable Diffusion WebUI 虚拟环境实录
人工智能·windows·笔记·python·stable diffusion·aigc·虚拟环境
小雨青年2 分钟前
智能交互新范式:拒绝“黑盒”,带你用 MateChat 与 DSL 构建“高可靠”的 NL2UI 引擎
前端·ai·华为云
数据与后端架构提升之路8 分钟前
感知模块详解:从 OpenCV/YOLO 脚本到 多模态多任务 BEV 架构
人工智能·机器学习·自动驾驶
CoderJia程序员甲10 分钟前
GitHub 热榜项目 - 日榜(2025-11-30)
ai·开源·大模型·github·ai教程
咚咚王者12 分钟前
人工智能之数据分析 Matplotlib:第五章 常见函数
人工智能·数据分析·matplotlib
豆奶特浓615 分钟前
谢飞机勇闯Java面试:从内容社区的缓存一致性到AI Agent,这次能飞多高?
java·微服务·ai·面试·架构·缓存一致性·feed流
天天找自己18 分钟前
TransNeXt 深度解析:聚合注意力机制的突破性视觉骨干网络
人工智能·pytorch·python·深度学习·神经网络
iiiiii1124 分钟前
【论文阅读笔记】IDAQ:离线元强化学习中的分布内在线适应
论文阅读·人工智能·笔记·学习·算法·机器学习·强化学习
Cleaner25 分钟前
大模型的手和脚:从提示工程到 MCP
人工智能·llm·mcp