Character AI 推出实时语音通话功能;AirPods 将配备红外摄像头模组丨 RTE 开发者日报

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻 」、「有态度的观点 」、「有意思的数据 」、「有思考的文章 」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@JLT,@鲍勃

01 有话题的新闻

1、Character AI 推出新语音功能,让你可以给 AI 角色「打电话」

Character.AI 推出了能与 AI 角色进行实时语音通话的功能,支持多种语言包括英语、西班牙语、和中文等。这项功能通过超过 300 万用户的测试,确保了通话体验的自然流畅性,与真人聊天无明显差异。

Character.AI 还增强了 AI 角色的现实感,通过「Character Voices」功能,用户可以选择或创建超过 100 万种独特的声音。(@AI Insights)

2、凡泰极客亮相华为 HDC2024,独创小程序一键生成鸿蒙 App 开发方案

在 2024 华为开发者大会上,凡泰极客为应用厂商带来了创新的解决方案。凡泰极客推出的 FinClip3.0 版本,为企业提供了一个低成本快速构建鸿蒙 App 的新途径。这一版本支持微信小程序一键生成鸿蒙 App,极大地简化了开发流程,降低了技术门槛。企业或开发者只需利用凡泰极客旗下的 FinClip Studio 小程序开发工具,即可轻松地将现有的小程序转化为轻量化的鸿蒙 App。

更进一步,通过在鸿蒙应用中集成 FinClip Harmony SDK,开发者可以迅速地将已有的微信小程序上架到自己的鸿蒙 App 内,整个过程无需对现有代码进行二次改造,这无疑大幅提升了开发效率。

在 HDC 大会上,凡泰极客的 FinClip 产品荣获「鸿蒙先锋-能力开放贡献」奖,这一荣誉不仅是对 FinClip 在鸿蒙轻量化原生应用领域深耕投入的认可,也是对其创新能力和技术实力的肯定。(@雷锋网)

3、AirPods 未来将配备红外摄像头模组,用于改善空间音频效果

6 月 30 日消息,郭明錤今日透露苹果公司计划在 2026 年为 AirPods 耳机添加红外摄像头模组。据介绍,这些模组与手机中常见的「红外夜视」摄像头不同,仅仅是提供环境深度信息(不会提供图像信息),主要用于改进用户空间音频体验。

此前,彭博社记者马克·古尔曼也曾透露苹果正研究如何在 AirPods 耳机上配备摄像头及更先进的人工智能和健康传感器。该项目的代号是 B798,于去年启动,核心思路在于寻找一种将较低分辨率的摄像头传感器嵌入 AirPods 耳机的方法。当时古尔曼表示摄像头可能与 AI 功能有关,例如「可以借助 AI 回答有关于用户正在观察的物体的问题」。(@IT 之家)

4、知乎发布 AI 搜索产品「知乎直答」

在知乎第十届盐 Club 新知青年大会上,知乎 CEO 周源介绍并发布了知乎最新 AI 产品「知乎直答」。

据介绍,该产品是 AI 搜索功能的正式产品化,同时拥有独立域名和服务入口,能为用户带来更优质的提问、搜索、结果生成和归纳体验。目前,该产品已在网页端上线,通过「zhida.ai」域名即可访问。

知乎官方也预告,接下来「知乎直答」将逐步推进 App 开发和多模态能力的引入,在与知乎社区更深度融合的同时,积极探索对外合作。(@爱范儿)

5、快手、百度地图时光机上线苹果 Vision Pro 头显

近日,快手官方宣布,推出苹果 Vision Pro 版本应用。Vision Pro 版本的快手可以多开屏幕和页面,实现「可以边刷视频、边浏览个人主页、边开启评论面板」。值得一提的是,快手 vp 版本还支持「比心」手势点赞视频的手势操作。

百度地图也上线了「百度地图时光机」的 Vision Pro 应用,用户可以在应用中「走动」,体验过去时间点的 360 度全景地图,用户视野向下,可查看当前地图的时间及地点信息,「双手合十」可切换眼前场景。(@爱范儿)

6、首个类 Sora 开源复现方案,Open Sora 可在英伟达 RTX 3090 显卡上 AI 生成视频

作为全球首个类 Sora(OpenAI 的文本生成视频模型)开源复现方案,Open-Sora 可以在英伟达 RTX 3090 GPU 上基于文本生成视频,最高可以生成 240P 分辨率、时长最长 4 秒的视频。

处理 AI 任务的 GPU 云服务提供商 Backprop 展示了基于 Open-Sora V1.2 的 AI 环境,展示 4 个基于提示词生成的视频。

Backprop 表示:「在 RTX 3090 GPU 上,用户可以生成最高 240p、时长 4 秒的视频,生成 2 秒视频大约需要 30 秒,4 秒视频大约需要 60 秒。对于 424x240 的输出来说,这已经是相当大的计算能力,4 秒钟的视频输出逼近 1 千万像素。」(@IT 之家)

02 有态度的观点

1、联想 CEO 杨元庆:帮助每个普通人从 AI 的力量中获益

在近日播出的《2024 中国·AI 盛典》节目上,联想集团董事长兼 CEO 杨元庆谈到了「人本智能」理念。

杨元庆表示,科技的发展一定要以人为中心、以人为本,「帮助每个普通人从 AI 的力量中获益,让大家的生活更加充实有趣,这是我们整个行业都共同面对的使命。」

谈到 AI 是否会取代人类工作的话题,杨元庆表示,每次技术进步都会打破很多旧饭碗,但又会诞生更多新机会。AI 会成为新质生产力的重要引擎,成为每个人日常生活的一部分。杨元庆也不担心 AI 会超出人们的控制,认为科技发展一定利大于弊。

杨元庆也表示,未来的 AI 将朝着混合式 AI 的方向发展,帮助到社会、企业和每个人,实现真正的 AI 普惠。(@爱范儿)

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

相关推荐
会飞的老朱2 小时前
医药集团数智化转型,智能综合管理平台激活集团管理新效能
大数据·人工智能·oa协同办公
聆风吟º3 小时前
CANN runtime 实战指南:异构计算场景中运行时组件的部署、调优与扩展技巧
人工智能·神经网络·cann·异构计算
Codebee5 小时前
能力中心 (Agent SkillCenter):开启AI技能管理新时代
人工智能
聆风吟º6 小时前
CANN runtime 全链路拆解:AI 异构计算运行时的任务管理与功能适配技术路径
人工智能·深度学习·神经网络·cann
uesowys6 小时前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark
AI_56786 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
User_芊芊君子6 小时前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer
智驱力人工智能7 小时前
小区高空抛物AI实时预警方案 筑牢社区头顶安全的实践 高空抛物检测 高空抛物监控安装教程 高空抛物误报率优化方案 高空抛物监控案例分享
人工智能·深度学习·opencv·算法·安全·yolo·边缘计算
qq_160144877 小时前
亲测!2026年零基础学AI的入门干货,新手照做就能上手
人工智能
Howie Zphile7 小时前
全面预算管理难以落地的核心真相:“完美模型幻觉”的认知误区
人工智能·全面预算