WWDC 苹果发布 AI 全家桶;三星宣布「实时翻译」将兼容第三方 App丨 RTE 开发者日报 Vol.222

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻 」、「有态度的观点 」、「有意思的数据 」、「有思考的文章 」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY,@JLT,@鲍勃

01有话题的新闻

1、苹果 Apple Intelligence 登场:提智 Siri,帮你管理通知等

6 月 11 日消息,苹果公司在今天召开的 2024 年度 WWDC 全球开发者大会上,正式宣布「苹果智能」(Apple Intelligence),将会为 iPhone、Mac 等设备提供一系列 AI 功能。

  • 帮你操作应用

苹果公司表示,其人工智能功能将能在应用程序中为你做一些事情。它将能够管理你的通知,自动为你写东西,或总结邮件和其他应用程序中的文本。

苹果还表示,它还能做一些事情,比如引用一个应用程序来执行另一个应用程序中的操作,比如让 Apple Intelligence 播放你女友发给你的播客。

  • Siri 变得更加智能

苹果公司表示,在 iOS 18 中,用户将能更自然地与 Siri 对话。新 Siri 可以理解上下文,因此你在随后的请求中不必重复信息。

App Intents 可以让 Siri 与第一方、第三方应用程序深度合作,在屏幕上感知你当前正在查看的内容,并能采取应用内操作。苹果演示了让照片应用编辑你正在查看的图片,Siri 会代表你执行调整。

  • 隐私

该公司表示,其人工智能功能将在设备上处理,以保证信息的私密性。不过,你需要 A17 Pro 或 M 系列芯片才能利用这些功能。此外,「语义索引」(semantic index)也是其中的一部分,它会在需要时获取个人信息,并在各个应用程序中显示出来。

对于需要调用云端的 AI 功能,苹果公司表示会使用「私有云」的,数据永远不会存储在服务器上,苹果公司也表示永远无法访问这些数据。该公司表示,将邀请独立专家来验证苹果的说法是否属实。(@IT 之家)

2、OpenAI 对 AI 语音引擎非常谨慎:可能永远不会被广泛使用

6 月 10 日消息,据外媒报道,几个月内,OpenAI 第二次解释其文本转音频工具,提醒大家该工具尚未广泛使用,也可能永远不会被广泛使用。该公司周五在其网站上发表的声明中表示:无论我们最终是否会广泛部署这项技术,让世界各地的人们了解其发展方向都很重要。这就是为什么我们要解释该模型的工作原理、我们如何将其用于研究和教育,以及我们如何围绕它实施安全措施。

去年年底,OpenAI 与公司外部的一小群用户分享了其语音引擎,该引擎依靠文本输入和 15 秒的人类声音片段来生成听起来与原始说话者非常相似的自然语音。该工具可以用多种语言创建听起来令人信服的人类声音。当时,该公司表示,它选择预览该技术但不会广泛发布,以增强社会韧性,以抵御越来越令人信服的生成模型的威胁。(@鞭牛士)

3、本地 AI 运行、支持简中,三星宣布「实时翻译」将兼容第三方 App

三星公司近日发布新闻稿,最新 Galaxy AI 套件中实时翻译(Live Translate)功能将兼容第三方应用程序,意味着用户可以在喜欢的应用中使用基于 AI 的翻译功能了。

实时翻译功能向第三方应用开放,无论是对于普通用户,还是专业用户来说都是好事,可以让用户更好地和外国朋友或商业伙伴保持联系,消除语言障碍。

三星尚未透露有关支持应用程序的更多具体细节。实时翻译功能不需要借助云服务,完全在本地设备上运行,因此用户始终掌控自己共享的数据。(@IT 之家)

4、EOS R7 + 双摄相机镜头可拍 3D 视频,苹果佳能合作共建「空间视频」生态

IT 之家 6 月 11 日消息,在目前正在进行的苹果 WWDC 2024 中,苹果公司宣布与佳能合作,将推出能拍摄 Apple 空间视频格式的「全新空间镜头」,该镜头为「RF-S 7.8mm F4 STM」,号称搭配佳能 EOS R7 相机效果更佳。

IT 之家获悉,佳能此前已经推出 RF5.2mm F2.8 L DUAL FISHEYE 鱼眼镜头,这款镜头国行售价 14399 元,主要用于拍摄 VR 视频,不过目前不得而知该镜头是否兼容相关空间视频模式。(@IT 之家)

02有态度的观点

1、傅盛评阿里云「最强开源模型」:长远看来,开源大模型能力会超越闭源

近日,阿里云发布开源模型 Qwen2-72B。据介绍,该模型性能超过美国最强的开源模型 Llama3-70B,也超过众多国内闭源大模型。对此,猎豹移动董事长兼 CEO、猎户星空董事长傅盛发视频表示,正当国内某大厂 CEO 说闭源模型的能力将持续超越开源模型时,阿里巴巴刚发布的 Qwen2-72B 开源模型能力已经超越了国内绝大多数闭源模型。

「我们之前一直认为开源大模型和闭源大模型会并驾齐驱,而且长远看来,我认为开源社区的大模型能力会超越闭源,这背后的原因就是开源并不是简单的做雷锋,而是结合自己的商业模式,结合能够形成社区的反馈能力的一套战略部署。」(@新浪科技)

2、Pika 团队:打败 Sora 不难,我们的算法能够以小胜大

即使 Sora 已经强势「炸」过场,Pika 还是再次带着硅谷一众明星资方的投票回到了舆论中心。6 月 5 日,Pika 宣布已完成 8000 万美元(约合人民币 5.8 亿元)的 B 轮融资,总融资额达到 1.35 亿美元,较 2023 年末,公司投后估值实现翻倍至 4.7 亿美元。

「我们会更 aggressive 地做视频大模型」,这家刚刚度过一周年生日的视频生成创业公司,计划在这轮融资之后快速扩张研究和工程师团队。(@机器之心)

3、马斯克怒喷苹果与 OpenAI 的合作:考虑禁止苹果设备进入我的公司

苹果宣布与 OpenAI 合作,将 GPT-4o 功能集成到苹果设备中。对此,马斯克表示强烈不满,认为这将构成安全风险,考虑禁止苹果设备进入他的公司,并要求使用苹果设备的人员在入口处接受检查,存放设备于法拉第笼中。

他还批评苹果无法自主开发 AI,却声称能确保 OpenAI 保护用户安全和隐私,认为这是出卖用户的行为。(@腾讯科技)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

相关推荐
小馒头学python2 分钟前
机器学习是什么?AIGC又是什么?机器学习与AIGC未来科技的双引擎
人工智能·python·机器学习
神奇夜光杯12 分钟前
Python酷库之旅-第三方库Pandas(202)
开发语言·人工智能·python·excel·pandas·标准库及第三方库·学习与成长
正义的彬彬侠14 分钟前
《XGBoost算法的原理推导》12-14决策树复杂度的正则化项 公式解析
人工智能·决策树·机器学习·集成学习·boosting·xgboost
Debroon24 分钟前
RuleAlign 规则对齐框架:将医生的诊断规则形式化并注入模型,无需额外人工标注的自动对齐方法
人工智能
羊小猪~~31 分钟前
神经网络基础--什么是正向传播??什么是方向传播??
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
AI小杨32 分钟前
【车道线检测】一、传统车道线检测:基于霍夫变换的车道线检测史诗级详细教程
人工智能·opencv·计算机视觉·霍夫变换·车道线检测
晨曦_子画36 分钟前
编程语言之战:AI 之后的 Kotlin 与 Java
android·java·开发语言·人工智能·kotlin
道可云38 分钟前
道可云人工智能&元宇宙每日资讯|2024国际虚拟现实创新大会将在青岛举办
大数据·人工智能·3d·机器人·ar·vr
人工智能培训咨询叶梓1 小时前
探索开放资源上指令微调语言模型的现状
人工智能·语言模型·自然语言处理·性能优化·调优·大模型微调·指令微调
zzZ_CMing1 小时前
大语言模型训练的全过程:预训练、微调、RLHF
人工智能·自然语言处理·aigc