文心一言上线声音定制功能;通义千问开源模型;openAI又侵权?

文心一言上线定制专属声音功能

百度旗下 AI 聊天机器人文心一言上线新功能,用户录音一句话,即可定制声音。

使用这项功能需要使用文心一言 App。在创建智能体中,点击创建自己的声音,朗读系统提示的一句话,等候几秒钟时间,系统就能捕捉到用户的声音特点,生成用户个人专属声音。

在专属语音库构建完成后,与智能体的每一次对话,都可以使用自己的音色进行语音播报。

阿里通义千问开源 320 亿参数模型

昨日,通义千问开源其 320 亿参数模型 Qwen1.5-32B。

据介绍,这一模型旨在对标最先进的 30 亿参数模型所设定的性能基准,同时,也提升了 Qwen1.5-32B-Chat 对话模型的对话能力。Qwen1.5-32B 系列模型的内存占用比 72B 模型大幅减少,运行速度显著提升。

通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。

OpenAI 疑似转录超一百万小时 YouTube 视频训练 GPT-4

《纽约时报》报道,OpenAI 为了得到高质量的 AI 训练数据,开发了一个音频转录模型「Whisper」,转录了超过 100 万个小时的 YouTube 视频来训练大语言模型 GPT-4。

据悉,OpenAI 知道这可能会存在法律风险,但是依然认为这是「合理使用」。《泰晤士报》报道称,OpenAI 总裁 Greg Brockman 亲自参与了这些被使用视频的收集。

Google 回应称,他们已经看到了有关 OpenAI 这些活动未经证实的报告。此前,YouTube CEO Neal Mohan 回应 OpenAI 疑似使用 YouTube 视频训练其视频生成工具 Sora 时表示,暂时没有直接证据能够证明 OpenAI 有相关行为。

相关推荐
geobuilding1 小时前
Geobuilding模型转换,深圳市科技风贴图建筑物3dtiles倾斜摄影数据
科技
TG:@yunlaoda360 云老大1 小时前
腾讯WAIC发布“1+3+N”AI全景图:混元3D世界模型开源,具身智能平台Tairos亮相
人工智能·3d·开源·腾讯云
这张生成的图像能检测吗1 小时前
(论文速读)Fast3R:在一个向前通道中实现1000+图像的3D重建
人工智能·深度学习·计算机视觉·3d重建
九河云3 小时前
软件开发平台 DevCloud
运维·服务器·数据库·科技·华为云
兴趣使然黄小黄4 小时前
【AI-agent】LangChain开发智能体工具流程
人工智能·microsoft·langchain
出门吃三碗饭4 小时前
Transformer前世今生——使用pytorch实现多头注意力(八)
人工智能·深度学习·transformer
l1t4 小时前
利用DeepSeek改写SQLite版本的二进制位数独求解SQL
数据库·人工智能·sql·sqlite
说私域5 小时前
开源AI智能名片链动2+1模式S2B2C商城小程序FAQ设计及其意义探究
人工智能·小程序
开利网络5 小时前
合规底线:健康产品营销的红线与避坑指南
大数据·前端·人工智能·云计算·1024程序员节
非著名架构师5 小时前
量化“天气风险”:金融与保险机构如何利用气候大数据实现精准定价与投资决策
大数据·人工智能·新能源风光提高精度·疾风气象大模型4.0