Character AI 推出实时语音通话功能；AirPods 将配备红外摄像头模组丨 RTE 开发者日报

开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@JLT，@鲍勃

01 有话题的新闻

1、Character AI 推出新语音功能，让你可以给 AI 角色「打电话」

Character.AI 推出了能与 AI 角色进行实时语音通话的功能，支持多种语言包括英语、西班牙语、和中文等。这项功能通过超过 300 万用户的测试，确保了通话体验的自然流畅性，与真人聊天无明显差异。

Character.AI 还增强了 AI 角色的现实感，通过「Character Voices」功能，用户可以选择或创建超过 100 万种独特的声音。(@AI Insights)

2、凡泰极客亮相华为 HDC2024，独创小程序一键生成鸿蒙 App 开发方案

在 2024 华为开发者大会上，凡泰极客为应用厂商带来了创新的解决方案。凡泰极客推出的 FinClip3.0 版本，为企业提供了一个低成本快速构建鸿蒙 App 的新途径。这一版本支持微信小程序一键生成鸿蒙 App，极大地简化了开发流程，降低了技术门槛。企业或开发者只需利用凡泰极客旗下的 FinClip Studio 小程序开发工具，即可轻松地将现有的小程序转化为轻量化的鸿蒙 App。

更进一步，通过在鸿蒙应用中集成 FinClip Harmony SDK，开发者可以迅速地将已有的微信小程序上架到自己的鸿蒙 App 内，整个过程无需对现有代码进行二次改造，这无疑大幅提升了开发效率。

在 HDC 大会上，凡泰极客的 FinClip 产品荣获「鸿蒙先锋-能力开放贡献」奖，这一荣誉不仅是对 FinClip 在鸿蒙轻量化原生应用领域深耕投入的认可，也是对其创新能力和技术实力的肯定。（@雷锋网）

3、AirPods 未来将配备红外摄像头模组，用于改善空间音频效果

6 月 30 日消息，郭明錤今日透露苹果公司计划在 2026 年为 AirPods 耳机添加红外摄像头模组。据介绍，这些模组与手机中常见的「红外夜视」摄像头不同，仅仅是提供环境深度信息（不会提供图像信息），主要用于改进用户空间音频体验。

此前，彭博社记者马克·古尔曼也曾透露苹果正研究如何在 AirPods 耳机上配备摄像头及更先进的人工智能和健康传感器。该项目的代号是 B798，于去年启动，核心思路在于寻找一种将较低分辨率的摄像头传感器嵌入 AirPods 耳机的方法。当时古尔曼表示摄像头可能与 AI 功能有关，例如「可以借助 AI 回答有关于用户正在观察的物体的问题」。（@IT 之家）

4、知乎发布 AI 搜索产品「知乎直答」

在知乎第十届盐 Club 新知青年大会上，知乎 CEO 周源介绍并发布了知乎最新 AI 产品「知乎直答」。

据介绍，该产品是 AI 搜索功能的正式产品化，同时拥有独立域名和服务入口，能为用户带来更优质的提问、搜索、结果生成和归纳体验。目前，该产品已在网页端上线，通过「zhida.ai」域名即可访问。

知乎官方也预告，接下来「知乎直答」将逐步推进 App 开发和多模态能力的引入，在与知乎社区更深度融合的同时，积极探索对外合作。（@爱范儿）

5、快手、百度地图时光机上线苹果 Vision Pro 头显

近日，快手官方宣布，推出苹果 Vision Pro 版本应用。Vision Pro 版本的快手可以多开屏幕和页面，实现「可以边刷视频、边浏览个人主页、边开启评论面板」。值得一提的是，快手 vp 版本还支持「比心」手势点赞视频的手势操作。

百度地图也上线了「百度地图时光机」的 Vision Pro 应用，用户可以在应用中「走动」，体验过去时间点的 360 度全景地图，用户视野向下，可查看当前地图的时间及地点信息，「双手合十」可切换眼前场景。（@爱范儿）

6、首个类 Sora 开源复现方案，Open Sora 可在英伟达 RTX 3090 显卡上 AI 生成视频

作为全球首个类 Sora（OpenAI 的文本生成视频模型）开源复现方案，Open-Sora 可以在英伟达 RTX 3090 GPU 上基于文本生成视频，最高可以生成 240P 分辨率、时长最长 4 秒的视频。

处理 AI 任务的 GPU 云服务提供商 Backprop 展示了基于 Open-Sora V1.2 的 AI 环境，展示 4 个基于提示词生成的视频。

Backprop 表示：「在 RTX 3090 GPU 上，用户可以生成最高 240p、时长 4 秒的视频，生成 2 秒视频大约需要 30 秒，4 秒视频大约需要 60 秒。对于 424x240 的输出来说，这已经是相当大的计算能力，4 秒钟的视频输出逼近 1 千万像素。」（@IT 之家）

02 有态度的观点

1、联想 CEO 杨元庆：帮助每个普通人从 AI 的力量中获益

在近日播出的《2024 中国·AI 盛典》节目上，联想集团董事长兼 CEO 杨元庆谈到了「人本智能」理念。

杨元庆表示，科技的发展一定要以人为中心、以人为本，「帮助每个普通人从 AI 的力量中获益，让大家的生活更加充实有趣，这是我们整个行业都共同面对的使命。」

谈到 AI 是否会取代人类工作的话题，杨元庆表示，每次技术进步都会打破很多旧饭碗，但又会诞生更多新机会。AI 会成为新质生产力的重要引擎，成为每个人日常生活的一部分。杨元庆也不担心 AI 会超出人们的控制，认为科技发展一定利大于弊。

杨元庆也表示，未来的 AI 将朝着混合式 AI 的方向发展，帮助到社会、企业和每个人，实现真正的 AI 普惠。（@爱范儿）

写在最后：

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻