文心一言上线声音定制功能;通义千问开源模型;openAI又侵权?

文心一言上线定制专属声音功能

百度旗下 AI 聊天机器人文心一言上线新功能,用户录音一句话,即可定制声音。

使用这项功能需要使用文心一言 App。在创建智能体中,点击创建自己的声音,朗读系统提示的一句话,等候几秒钟时间,系统就能捕捉到用户的声音特点,生成用户个人专属声音。

在专属语音库构建完成后,与智能体的每一次对话,都可以使用自己的音色进行语音播报。

阿里通义千问开源 320 亿参数模型

昨日,通义千问开源其 320 亿参数模型 Qwen1.5-32B。

据介绍,这一模型旨在对标最先进的 30 亿参数模型所设定的性能基准,同时,也提升了 Qwen1.5-32B-Chat 对话模型的对话能力。Qwen1.5-32B 系列模型的内存占用比 72B 模型大幅减少,运行速度显著提升。

通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。

OpenAI 疑似转录超一百万小时 YouTube 视频训练 GPT-4

《纽约时报》报道,OpenAI 为了得到高质量的 AI 训练数据,开发了一个音频转录模型「Whisper」,转录了超过 100 万个小时的 YouTube 视频来训练大语言模型 GPT-4。

据悉,OpenAI 知道这可能会存在法律风险,但是依然认为这是「合理使用」。《泰晤士报》报道称,OpenAI 总裁 Greg Brockman 亲自参与了这些被使用视频的收集。

Google 回应称,他们已经看到了有关 OpenAI 这些活动未经证实的报告。此前,YouTube CEO Neal Mohan 回应 OpenAI 疑似使用 YouTube 视频训练其视频生成工具 Sora 时表示,暂时没有直接证据能够证明 OpenAI 有相关行为。

相关推荐
lihuayong5 分钟前
LangGraph React智能体 - 推理与行动的完美结合
人工智能·langgraph·react 智能体
机器之心8 分钟前
Meta用40万个GPU小时做了一个实验,只为弄清强化学习Scaling Law
人工智能·openai
曾经的三心草11 分钟前
OpenCV5-图像特征harris-sift-特征匹配-图像全景拼接-答题卡识别判卷
人工智能·opencv·计算机视觉
慧星云25 分钟前
魔多 AI 支持 Wan 系列在线训练 :解锁视频生成新高度
人工智能
麻辣兔变形记31 分钟前
Solidity 合约超限问题及优化策略:以 FHEFactory 为例
人工智能·区块链
渡我白衣1 小时前
未来的 AI 操作系统(二)——世界即界面:自然语言成为新的人机交互协议
人工智能·语言模型·人机交互
墨利昂1 小时前
词向量:自然语言处理技术体系的核心基石
人工智能·自然语言处理
格林威1 小时前
可见光工业相机半导体制造领域中的应用
图像处理·人工智能·数码相机·计算机视觉·视觉检测·制造·工业相机
星期天要睡觉1 小时前
计算机视觉(opencv)——基于 MediaPipe 人体姿态检测
人工智能·opencv·计算机视觉
资讯全球2 小时前
2025机器人自动化打磨抛光设备及汽车零件打磨新技术10月应用解析
人工智能·机器人·自动化