Character AI 推出实时语音通话功能;AirPods 将配备红外摄像头模组丨 RTE 开发者日报

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻 」、「有态度的观点 」、「有意思的数据 」、「有思考的文章 」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@JLT,@鲍勃

01 有话题的新闻

1、Character AI 推出新语音功能,让你可以给 AI 角色「打电话」

Character.AI 推出了能与 AI 角色进行实时语音通话的功能,支持多种语言包括英语、西班牙语、和中文等。这项功能通过超过 300 万用户的测试,确保了通话体验的自然流畅性,与真人聊天无明显差异。

Character.AI 还增强了 AI 角色的现实感,通过「Character Voices」功能,用户可以选择或创建超过 100 万种独特的声音。(@AI Insights)

2、凡泰极客亮相华为 HDC2024,独创小程序一键生成鸿蒙 App 开发方案

在 2024 华为开发者大会上,凡泰极客为应用厂商带来了创新的解决方案。凡泰极客推出的 FinClip3.0 版本,为企业提供了一个低成本快速构建鸿蒙 App 的新途径。这一版本支持微信小程序一键生成鸿蒙 App,极大地简化了开发流程,降低了技术门槛。企业或开发者只需利用凡泰极客旗下的 FinClip Studio 小程序开发工具,即可轻松地将现有的小程序转化为轻量化的鸿蒙 App。

更进一步,通过在鸿蒙应用中集成 FinClip Harmony SDK,开发者可以迅速地将已有的微信小程序上架到自己的鸿蒙 App 内,整个过程无需对现有代码进行二次改造,这无疑大幅提升了开发效率。

在 HDC 大会上,凡泰极客的 FinClip 产品荣获「鸿蒙先锋-能力开放贡献」奖,这一荣誉不仅是对 FinClip 在鸿蒙轻量化原生应用领域深耕投入的认可,也是对其创新能力和技术实力的肯定。(@雷锋网)

3、AirPods 未来将配备红外摄像头模组,用于改善空间音频效果

6 月 30 日消息,郭明錤今日透露苹果公司计划在 2026 年为 AirPods 耳机添加红外摄像头模组。据介绍,这些模组与手机中常见的「红外夜视」摄像头不同,仅仅是提供环境深度信息(不会提供图像信息),主要用于改进用户空间音频体验。

此前,彭博社记者马克·古尔曼也曾透露苹果正研究如何在 AirPods 耳机上配备摄像头及更先进的人工智能和健康传感器。该项目的代号是 B798,于去年启动,核心思路在于寻找一种将较低分辨率的摄像头传感器嵌入 AirPods 耳机的方法。当时古尔曼表示摄像头可能与 AI 功能有关,例如「可以借助 AI 回答有关于用户正在观察的物体的问题」。(@IT 之家)

4、知乎发布 AI 搜索产品「知乎直答」

在知乎第十届盐 Club 新知青年大会上,知乎 CEO 周源介绍并发布了知乎最新 AI 产品「知乎直答」。

据介绍,该产品是 AI 搜索功能的正式产品化,同时拥有独立域名和服务入口,能为用户带来更优质的提问、搜索、结果生成和归纳体验。目前,该产品已在网页端上线,通过「zhida.ai」域名即可访问。

知乎官方也预告,接下来「知乎直答」将逐步推进 App 开发和多模态能力的引入,在与知乎社区更深度融合的同时,积极探索对外合作。(@爱范儿)

5、快手、百度地图时光机上线苹果 Vision Pro 头显

近日,快手官方宣布,推出苹果 Vision Pro 版本应用。Vision Pro 版本的快手可以多开屏幕和页面,实现「可以边刷视频、边浏览个人主页、边开启评论面板」。值得一提的是,快手 vp 版本还支持「比心」手势点赞视频的手势操作。

百度地图也上线了「百度地图时光机」的 Vision Pro 应用,用户可以在应用中「走动」,体验过去时间点的 360 度全景地图,用户视野向下,可查看当前地图的时间及地点信息,「双手合十」可切换眼前场景。(@爱范儿)

6、首个类 Sora 开源复现方案,Open Sora 可在英伟达 RTX 3090 显卡上 AI 生成视频

作为全球首个类 Sora(OpenAI 的文本生成视频模型)开源复现方案,Open-Sora 可以在英伟达 RTX 3090 GPU 上基于文本生成视频,最高可以生成 240P 分辨率、时长最长 4 秒的视频。

处理 AI 任务的 GPU 云服务提供商 Backprop 展示了基于 Open-Sora V1.2 的 AI 环境,展示 4 个基于提示词生成的视频。

Backprop 表示:「在 RTX 3090 GPU 上,用户可以生成最高 240p、时长 4 秒的视频,生成 2 秒视频大约需要 30 秒,4 秒视频大约需要 60 秒。对于 424x240 的输出来说,这已经是相当大的计算能力,4 秒钟的视频输出逼近 1 千万像素。」(@IT 之家)

02 有态度的观点

1、联想 CEO 杨元庆:帮助每个普通人从 AI 的力量中获益

在近日播出的《2024 中国·AI 盛典》节目上,联想集团董事长兼 CEO 杨元庆谈到了「人本智能」理念。

杨元庆表示,科技的发展一定要以人为中心、以人为本,「帮助每个普通人从 AI 的力量中获益,让大家的生活更加充实有趣,这是我们整个行业都共同面对的使命。」

谈到 AI 是否会取代人类工作的话题,杨元庆表示,每次技术进步都会打破很多旧饭碗,但又会诞生更多新机会。AI 会成为新质生产力的重要引擎,成为每个人日常生活的一部分。杨元庆也不担心 AI 会超出人们的控制,认为科技发展一定利大于弊。

杨元庆也表示,未来的 AI 将朝着混合式 AI 的方向发展,帮助到社会、企业和每个人,实现真正的 AI 普惠。(@爱范儿)

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

相关推荐
Aileen_0v01 小时前
【玩转OCR | 腾讯云智能结构化OCR在图像增强与发票识别中的应用实践】
android·java·人工智能·云计算·ocr·腾讯云·玩转腾讯云ocr
阿正的梦工坊2 小时前
深入理解 PyTorch 的 view() 函数:以多头注意力机制(Multi-Head Attention)为例 (中英双语)
人工智能·pytorch·python
Ainnle2 小时前
GPT-O3:简单介绍
人工智能
OceanBase数据库官方博客2 小时前
向量检索+大语言模型,免费搭建基于专属知识库的 RAG 智能助手
人工智能·oceanbase·分布式数据库·向量数据库·rag
测试者家园2 小时前
ChatGPT助力数据可视化与数据分析效率的提升(一)
软件测试·人工智能·信息可视化·chatgpt·数据挖掘·数据分析·用chatgpt做软件测试
Loving_enjoy4 小时前
ChatGPT详解
人工智能·自然语言处理
人类群星闪耀时4 小时前
深度学习在灾难恢复中的作用:智能运维的新时代
运维·人工智能·深度学习
图王大胜4 小时前
模型 确认偏误(关键决策)
人工智能·职业发展·管理·心理·认知·决策
机器懒得学习5 小时前
从随机生成到深度学习:使用DCGAN和CycleGAN生成图像的实战教程
人工智能·深度学习