文心一言上线声音定制功能;通义千问开源模型;openAI又侵权?

文心一言上线定制专属声音功能

百度旗下 AI 聊天机器人文心一言上线新功能,用户录音一句话,即可定制声音。

使用这项功能需要使用文心一言 App。在创建智能体中,点击创建自己的声音,朗读系统提示的一句话,等候几秒钟时间,系统就能捕捉到用户的声音特点,生成用户个人专属声音。

在专属语音库构建完成后,与智能体的每一次对话,都可以使用自己的音色进行语音播报。

阿里通义千问开源 320 亿参数模型

昨日,通义千问开源其 320 亿参数模型 Qwen1.5-32B。

据介绍,这一模型旨在对标最先进的 30 亿参数模型所设定的性能基准,同时,也提升了 Qwen1.5-32B-Chat 对话模型的对话能力。Qwen1.5-32B 系列模型的内存占用比 72B 模型大幅减少,运行速度显著提升。

通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。

OpenAI 疑似转录超一百万小时 YouTube 视频训练 GPT-4

《纽约时报》报道,OpenAI 为了得到高质量的 AI 训练数据,开发了一个音频转录模型「Whisper」,转录了超过 100 万个小时的 YouTube 视频来训练大语言模型 GPT-4。

据悉,OpenAI 知道这可能会存在法律风险,但是依然认为这是「合理使用」。《泰晤士报》报道称,OpenAI 总裁 Greg Brockman 亲自参与了这些被使用视频的收集。

Google 回应称,他们已经看到了有关 OpenAI 这些活动未经证实的报告。此前,YouTube CEO Neal Mohan 回应 OpenAI 疑似使用 YouTube 视频训练其视频生成工具 Sora 时表示,暂时没有直接证据能够证明 OpenAI 有相关行为。

相关推荐
还有糕手12 分钟前
西南交通大学【机器学习实验2】
人工智能·机器学习
jndingxin14 分钟前
OpenCV CUDA模块设备层-----在 GPU 上执行类似于 std::copy 的操作函数warpCopy()
人工智能·opencv·计算机视觉
weixin_3776348415 分钟前
【数据增强】精细化贴图数据增强
人工智能·目标检测·贴图
中钧科技17 分钟前
中钧科技亮相2025 亚欧商品贸易博览会,赋能数字经济新未来!
科技
2401_8353024818 分钟前
佰力博科技与您探讨压电材料的原理与压电效应的应用
科技·能源·材料工程
老A技术联盟20 分钟前
超实用的Cursor使用技巧之案列分析-教你基于Cursor零代码开发一个chrome插件
人工智能·cursor
慧星云24 分钟前
ComfyUI工作流 :一键换背景体验不同场景
人工智能
程序员的小马甲26 分钟前
如何编写AI提示词
人工智能·程序员·产品经理
算家计算26 分钟前
4 位量化 + FP8 混合精度:ERNIE-4.5-0.3B-Paddle本地部署,重新定义端侧推理效率
人工智能·开源
晓131329 分钟前
OpenCV篇——项目(二)OCR文档扫描
人工智能·python·opencv·pycharm·ocr