GPT-4 Turbo 融合视觉能力;Google 新添 AI 视频应用 Vids丨 RTE 开发者日报 Vol.181

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的新闻 」、「有态度的观点 」、「有意思的数据 」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY,@JLT,@鲍勃

01有话题的新闻

1、英特尔发布 Gaudi 3 AI 芯片:性能超越英伟达 H100,第三季度上市

4 月 9 日 Vision 2024 活动中,英特尔发布了新一代 Gaudi 3 AI 芯片,并将于 2024 年第三季度通过 OEM 系统大批量上市。据介绍,新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%,推理能力提高了 50%,效率提高了 40%,但成本却低得多。

此外,英特尔还为其数据中心 CPU 产品组合推出了全新品牌命名:原代号为 Granite Rapids 和 Sierra Forest 的芯片现在将被称为「Xeon 6」系列。这些芯片计划于今年上市,并将支持全新性能提升的标准化 MXFP4 数据格式。

英特尔同时宣布正在开发用于以太网网络的 AI NIC ASIC 以及 AI NIC 小芯片。(@IT 之家)

2、融合视觉能力,OpenAI 向开发人员提供 GPT-4 Turbo with Vision

OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。

在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应用前景。(@CSDN)

3、Vision Pro 开发者称苹果过度注重隐私,潜能难发挥

据外媒报道,苹果为了避免重蹈 Google Glass 的覆辙,在 Vision Pro 的隐私保护上设置了非常严格的限制,这在一定程度上限制了第三方开发者发挥创意的空间。Vision Pro 的开发者并不能直接获取设备摄像头的数据,他们只能访问「周围环境数据」。

这份数据由摄像头和激光雷达数据共同生成,可以构建周围环境的三维模型。报道援引了前苹果员工的说法,苹果之所以如此重视隐私,部分原因是为了避免 Vision Pro 变成第二个 Google Glass。十多年前,Google Glass 因为内置摄像头而引发了巨大的隐私争议,让周围的人感到不安。(@IT 之家)

4、Google Vids 让人人都成为视频创作达人

4 月 9 日,谷歌在其年度开发者大会 Google Cloud Next '24 上推出了 Workspace 家族的新成员------AI 驱动的视频创作应用 Vids,Google Vids可以帮助用户生成视频内容的分镜脚本、选择风格、编辑草稿,提供预录制的旁白功能。有了 Vids,用户可以在工作中轻松创建和分享视频内容。

谷歌将 Vids 定位为继文档、表格、幻灯片之后的第四生产力应用。Vids 大幅降低了视频创作门槛,让员工可以更高效地在日常工作中运用视频这一表现力丰富的媒体形式。Vids 有望在企业内部掀起一股「人人都是视频创作者」的新浪潮。(@kate 人不错)

02有态度的观点

1、马斯克最新访谈:中国 AI 不会落后于西方,中国汽车公司最具竞争力

马斯克在 X Space 的直播中接受访谈表示,中国有很多非常聪明的人,他们在 AI 上不会落后于世界其他地方,也不会落后于美国。

马斯克还称,在电动汽车或一般汽车领域,中国汽车公司是迄今为止最具竞争力的,这是最严峻的竞争挑战,他们制造出很棒的汽车,并且非常努力。(@Web3 天空之城)

2、罗永浩回应为何不造车:现在造车已晚,9 月将发布科技产品

在近日的直播中,罗永浩谈到自己为何不造车,他幽默回应:「有人说你造车我必买,少来,我当时做手机时你就这么说的」。罗永浩解释自己过去几年里曾考虑过造车,但他认为现在造车资本要求更高,融资要求更高,难度更大,造车的周期更长,没有成熟的供应链解决完美的生产制造,所以他评估下来觉得现在造车已经晚了。

对于备受关注的小米首款汽车 SU7,罗永浩此前评价称:小米很可能继平价手机市场之后,在大众消费车市场上重新上演良币驱逐劣币的史诗性一幕。罗永浩还透露自己即将在 9 月份举办发布会,发布一款科技产品,定价为 199 和 299 美元,不过他并没有透露产品的具体信息。(@IT 之家)

03有思考的文章

1、《:-) 表情符号的诞生、传播和发展》

「:-) 和 :-( 这些表情符号不是从古代流传下来的,它们竟然有发明者!」( @The Nexus)

@杜金房:早期的网络社交,简单又优雅。

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

相关推荐
数据分析能量站11 分钟前
神经网络-AlexNet
人工智能·深度学习·神经网络
Ven%17 分钟前
如何修改pip全局缓存位置和全局安装包存放路径
人工智能·python·深度学习·缓存·自然语言处理·pip
szxinmai主板定制专家30 分钟前
【NI国产替代】基于国产FPGA+全志T3的全国产16振动+2转速(24bits)高精度终端采集板卡
人工智能·fpga开发
YangJZ_ByteMaster39 分钟前
EndtoEnd Object Detection with Transformers
人工智能·深度学习·目标检测·计算机视觉
Anlici40 分钟前
模型训练与数据分析
人工智能·机器学习
余~~185381628001 小时前
NFC 碰一碰发视频源码搭建技术详解,支持OEM
开发语言·人工智能·python·音视频
唔皇万睡万万睡1 小时前
五子棋小游戏设计(Matlab)
人工智能·matlab·游戏程序
视觉语言导航2 小时前
AAAI-2024 | 大语言模型赋能导航决策!NavGPT:基于大模型显式推理的视觉语言导航
人工智能·具身智能
volcanical2 小时前
Bert各种变体——RoBERTA/ALBERT/DistillBert
人工智能·深度学习·bert
知来者逆2 小时前
Binoculars——分析证实大语言模型生成文本的检测和引用量按学科和国家明确显示了使用偏差的多样性和对内容类型的影响
人工智能·深度学习·语言模型·自然语言处理·llm·大语言模型