借助文心大模型4.0轻松搞定中文语境,生成技术视频十分强悍,并能自主添加各种方言!

在10月17日的百度世界2023上,文心大模型4.0版本正式发布!百度直接放话:文心大模型4.0是目前最强大的文心大模型。会上百度董事长李彦宏为我们展示了文心大模型4.0在搜索、地图、商业智能、智能会议、智能视频、多轮对话方面的强悍。那文心大模型4.0真有这么好?我们在第一时间拿到测试资格,并进行了实际实测。

相比文心大模型3.5刚出来的时候,文心大模型4.0现在已经进化出了更多功能,光是插件就有8个,包括一镜流影(文字转视频)、说图解画(看图说话)、E言易图(可视化数据分析)等。

这些插件还可以自由组合,来完成更复杂的任务。

今天我们先从更基础的角度出发,中文理解能力、视频生成能力、中文方言能力等3个方面,来给大家介绍下文心大模型4.0以及插件一镜流影,在视频方面的能力。

理解能力,尤其是中文理解能力

先来看看文心大模型4.0的理解能力。这里主要考考它应对**"语言陷阱"的能力,以及技术专用语的"识别力"**。文心大模型4.0的回答很简洁,直接给出答案。

回答的Docker是计算机里的一个开源的应用容器引擎以及它的作用。

生成能力,尤其是生成视频的能力

那么接下来这波,我们测试一下文心一言4.0生成视频的能力,看看这种神奇的能力,它是否具备。这时候我们就得看看文心一言的插件了,一镜流影(文字转视频),也就是文心一言4.0生成视频的能力。

"一镜流影"是文心一言4.0里的插件,通过一种技术手段,将文字内容自动转换为视频形式,使得文字能够以更生动、形象的方式呈现出来。这种技术可以应用于各种文本内容,如新闻报道、小说、诗歌等,将其转化为具有视觉效果的动态影像,为观众带来更加丰富和直观的观看体验。一镜流影技术可以大大提高内容的表现力和吸引力,有助于更好地传达文本中所包含的信息和情感。

我们接下来尝试下,使用一镜流影(文字转视频)功能去生成视频。使用文心一言4.0的一镜流影,文案:什么是docker,生成一段30秒的视频详解。

我们看一下一镜流影插件生成视频,不仅仅是生成一段docker容器的剪辑,没想到连文案和字幕语音都配好了,完成度很高。看到这里不得不感慨技术的进步,视频剪辑已经不是专业运营人员的专用了,我们使用文心一言4.0插件一镜流影,也能快速产出输出一个高质量的宣传视频了。

方言能力

然后,是方言能力测试。文心大模型4.0说是重点升级了数学计算能力,我们就直接上方言测试,看它是否能支持各种方言:

以下是一个使用四川话播报的介绍Docker的视频脚本: [背景音乐起,轻松明快] 旁白(四川话):Docker是个啥?Docker就是一种开源的应用容器引擎,让我们可以打包应用和依赖包到一个可移植的镜像中,发布到任何流行的Linux或Windows操作系统上。 [镜头切换,展示Docker图标和官网] 旁白(四川话):Docker可以帮助我们更快地交付应用,将应用程序和基础设施层隔离,像管理程序一样管理基础设施。 [镜头切换,展示Docker容器运行的示例] 旁白(四川话):使用Docker,我们可以更快地打包、测试和部署应用程序,缩短从编写到部署运行代码的周期。 [镜头切换,展示Docker在开发流程中的应用] 旁白(四川话):总之,Docker就是一种让我们轻松搞定应用部署和管理的神器!

粤语版

四川话版

总结

测到这里,不妨做个小小的总结:整体来看,中文理解能力、视频生成能力、中文方言能力都很强悍。首先能够根据我们的对话,生成视频脚本;其次能够通过插件把视频脚本转成视频;最后还可以任意改变语言,能支持中文里的方言。

从3月份文心一言发布,到年中文心大模型3.5版本更新,再到现在4.0惊艳亮相,百度文心大模型的迭代速度不可谓不迅速。这一次的评测,在视频生成方面的惊艳表现,确实非常惊人,是对传统的视频剪辑的颠覆。再一次体现了百度在大模型领域深厚的技术积累。

展望AI原生的新时代,文心一言大模型基础能力的快速进步,以及AI原生应用开发的颠覆式操作和表现,都令人感慨,未来是科技的时代,也是智能的时代。

相关推荐
量子位3 分钟前
老黄入局吃龙虾!英伟达发布最强开源Agent推理模型
aigc·openai
树獭叔叔1 小时前
检索增强生成(RAG):让大模型突破知识边界
后端·aigc·openai
thulium_1 小时前
Windows Ubuntu 本地部署OpenClaw
windows·ubuntu·aigc
来一斤小鲜肉1 小时前
Spring AI核心:高阶API之ChatMemory
langchain·aigc
JEECG官方2 小时前
Mac Studio M4 通过 vLLM 部署本地大模型,对接 Jeecg-AI
低代码·llm·aigc
JavaGuide4 小时前
再见 OpenClaw,MaxClaw 一键平替,企业微信/微博/飞书/钉钉接入
aigc·openai
小程故事多_805 小时前
OpenClaw 实战|多 Agent 打通小红书:数据收集 + 笔记编写 + 自动发布一步到位
人工智能·笔记·aigc
xhxxx6 小时前
RAG实战-基于 Milvus 和 LangChain 实现的天龙八部阅读助手
后端·langchain·aigc
老十三·6 小时前
从深锡 “龙虾政策” 看 AI 产业新风口:开源智能体与 OPC 模式的政策红利解析
人工智能·安全·开源·aigc
杀生丸学AI7 小时前
【世界模型】WorldWarp:异步视频扩散的3D重建
3d·aigc·扩散模型·视觉大模型·世界模型·点云分割·高斯泼溅