文心一言上线声音定制功能;通义千问开源模型;openAI又侵权?

文心一言上线定制专属声音功能

百度旗下 AI 聊天机器人文心一言上线新功能,用户录音一句话,即可定制声音。

使用这项功能需要使用文心一言 App。在创建智能体中,点击创建自己的声音,朗读系统提示的一句话,等候几秒钟时间,系统就能捕捉到用户的声音特点,生成用户个人专属声音。

在专属语音库构建完成后,与智能体的每一次对话,都可以使用自己的音色进行语音播报。

阿里通义千问开源 320 亿参数模型

昨日,通义千问开源其 320 亿参数模型 Qwen1.5-32B。

据介绍,这一模型旨在对标最先进的 30 亿参数模型所设定的性能基准,同时,也提升了 Qwen1.5-32B-Chat 对话模型的对话能力。Qwen1.5-32B 系列模型的内存占用比 72B 模型大幅减少,运行速度显著提升。

通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。

OpenAI 疑似转录超一百万小时 YouTube 视频训练 GPT-4

《纽约时报》报道,OpenAI 为了得到高质量的 AI 训练数据,开发了一个音频转录模型「Whisper」,转录了超过 100 万个小时的 YouTube 视频来训练大语言模型 GPT-4。

据悉,OpenAI 知道这可能会存在法律风险,但是依然认为这是「合理使用」。《泰晤士报》报道称,OpenAI 总裁 Greg Brockman 亲自参与了这些被使用视频的收集。

Google 回应称,他们已经看到了有关 OpenAI 这些活动未经证实的报告。此前,YouTube CEO Neal Mohan 回应 OpenAI 疑似使用 YouTube 视频训练其视频生成工具 Sora 时表示,暂时没有直接证据能够证明 OpenAI 有相关行为。

相关推荐
Agent产品评测局1 分钟前
离散制造业生产流程优化,AI落地实操步骤详解:从传统自动化到企业级智能体的技术范式跃迁
运维·人工智能·ai·自动化
rainbow7242441 分钟前
零基础职场人线上学习AI,是否支持线上考试?
人工智能·学习
还是转转2 分钟前
深入认识 Agent —— 实现你自己的 Agent
ai·agent
小羊Yveesss3 分钟前
2026年前端开发新趋势:智能协同、工具革新与场景深耕
前端·ai
360亿方智能4 分钟前
走向Agent-Native!360AI知识库打通业务底座,让人与AI自然协同
人工智能
love530love5 分钟前
Python 3.12 解决 MediaPipe “no attribute ‘solutions‘” 终极方案:基于全版本硬核实测的避坑指南
开发语言·人工智能·windows·python·comfyui·mediapipe·solutions
fengyehongWorld9 分钟前
AI 专有名词释义
人工智能
RkxI7soAM10 分钟前
冷钱包选购的安全标准答案:锁定Ledger官方授权店铺
人工智能·安全
<-->11 分钟前
sglang-omni [多模态大语言模型的推理与评测框架]
人工智能·语言模型·自然语言处理
小程故事多_8012 分钟前
[大模型面试系列] 破解 Agent 软故障困局,四层防御 + 可观测性,筑牢生产级稳健性防线
人工智能·面试·职场和发展·智能体