文心一言上线声音定制功能；通义千问开源模型；openAI又侵权？

无际Ai2024-04-14 11:33

百度旗下 AI 聊天机器人文心一言上线新功能，用户录音一句话，即可定制声音。

使用这项功能需要使用文心一言 App。在创建智能体中，点击创建自己的声音，朗读系统提示的一句话，等候几秒钟时间，系统就能捕捉到用户的声音特点，生成用户个人专属声音。

在专属语音库构建完成后，与智能体的每一次对话，都可以使用自己的音色进行语音播报。

昨日，通义千问开源其 320 亿参数模型 Qwen1.5-32B。

据介绍，这一模型旨在对标最先进的 30 亿参数模型所设定的性能基准，同时，也提升了 Qwen1.5-32B-Chat 对话模型的对话能力。Qwen1.5-32B 系列模型的内存占用比 72B 模型大幅减少，运行速度显著提升。

通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。

《纽约时报》报道，OpenAI 为了得到高质量的 AI 训练数据，开发了一个音频转录模型「Whisper」，转录了超过 100 万个小时的 YouTube 视频来训练大语言模型 GPT-4。

据悉，OpenAI 知道这可能会存在法律风险，但是依然认为这是「合理使用」。《泰晤士报》报道称，OpenAI 总裁 Greg Brockman 亲自参与了这些被使用视频的收集。

Google 回应称，他们已经看到了有关 OpenAI 这些活动未经证实的报告。此前，YouTube CEO Neal Mohan 回应 OpenAI 疑似使用 YouTube 视频训练其视频生成工具 Sora 时表示，暂时没有直接证据能够证明 OpenAI 有相关行为。