文心一言上线声音定制功能;通义千问开源模型;openAI又侵权?

文心一言上线定制专属声音功能

百度旗下 AI 聊天机器人文心一言上线新功能,用户录音一句话,即可定制声音。

使用这项功能需要使用文心一言 App。在创建智能体中,点击创建自己的声音,朗读系统提示的一句话,等候几秒钟时间,系统就能捕捉到用户的声音特点,生成用户个人专属声音。

在专属语音库构建完成后,与智能体的每一次对话,都可以使用自己的音色进行语音播报。

阿里通义千问开源 320 亿参数模型

昨日,通义千问开源其 320 亿参数模型 Qwen1.5-32B。

据介绍,这一模型旨在对标最先进的 30 亿参数模型所设定的性能基准,同时,也提升了 Qwen1.5-32B-Chat 对话模型的对话能力。Qwen1.5-32B 系列模型的内存占用比 72B 模型大幅减少,运行速度显著提升。

通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。

OpenAI 疑似转录超一百万小时 YouTube 视频训练 GPT-4

《纽约时报》报道,OpenAI 为了得到高质量的 AI 训练数据,开发了一个音频转录模型「Whisper」,转录了超过 100 万个小时的 YouTube 视频来训练大语言模型 GPT-4。

据悉,OpenAI 知道这可能会存在法律风险,但是依然认为这是「合理使用」。《泰晤士报》报道称,OpenAI 总裁 Greg Brockman 亲自参与了这些被使用视频的收集。

Google 回应称,他们已经看到了有关 OpenAI 这些活动未经证实的报告。此前,YouTube CEO Neal Mohan 回应 OpenAI 疑似使用 YouTube 视频训练其视频生成工具 Sora 时表示,暂时没有直接证据能够证明 OpenAI 有相关行为。

相关推荐
编码小哥2 小时前
OpenCV Haar级联分类器:人脸检测入门
人工智能·计算机视觉·目标跟踪
程序员:钧念2 小时前
深度学习与强化学习的区别
人工智能·python·深度学习·算法·transformer·rag
数据与后端架构提升之路3 小时前
TeleTron 源码揭秘:如何用适配器模式“无缝魔改” Megatron-Core?
人工智能·python·适配器模式
Chef_Chen3 小时前
数据科学每日总结--Day44--机器学习
人工智能·机器学习
这张生成的图像能检测吗3 小时前
(论文速读)FR-IQA:面向广义图像质量评价:放松完美参考质量假设
人工智能·计算机视觉·图像增强·图像质量评估指标
KG_LLM图谱增强大模型4 小时前
本体论与知识图谱:揭示语义技术的核心差异
人工智能·知识图谱·本体论
JicasdC123asd4 小时前
黄瓜植株目标检测:YOLOv8结合Fasternet与BiFPN的高效改进方案
人工智能·yolo·目标检测
爱吃泡芙的小白白5 小时前
深入解析:2024年AI大模型核心算法与应用全景
人工智能·算法·大模型算法
哥布林学者5 小时前
吴恩达深度学习课程五:自然语言处理 第二周:词嵌入(二)词嵌入模型原理
深度学习·ai
小程故事多_805 小时前
攻克RAG系统最后一公里 图文混排PDF解析的挑战与实战方案
人工智能·架构·pdf·aigc