AIGC9: 火山引擎AI创新巡展

上图是一个参加技术大会的程序员,使用豆包文生图得到。

背景

随着计算机硬件发展、互联网普及、深度学习技术突破以及大数据的积累,人工智能在 21 世纪迎来快速发展。

2012 年深度学习技术在图像识别领域取得突破,

2017 年 Google 提出 Transformer 架构,奠定大模型预训练算法基础。

2022 年 OpenAI 推出的 ChatGPT 更是引发了全球对人工智能的高度关注。

开始前

14点开始,我是13点到的。

地点在深圳鹏瑞酒店2楼,到了之后门口有指路的。直接走进去,连上两层电梯。

门口安检进去,然后扫描签到,拿一张参会嘉宾卡。

会议室前面有4个展台。简单拍了一下,也体验了一把。

分别是: 豆包APP: 我玩过很久了,体验比国内其它的AI应用要好。

HiAgent:快速定制智能体,录入提示词,知识库,选择模型,可以直接使用api调用。

海绵音乐:可以创作歌词,选择音色和风格创造音乐。

猫箱:一张图,对应的智能体会跟你聊天。

然后是一个摩天轮,上面是豆包上的各种模型。

然后是按照大纲听了各位老总的讲解。

谭待 -豆包模型能力演讲

首先感谢谭总。

我简单叙述和思考一下。

豆包大模型一天使用的token数量13000亿,图片处理5000万张,语音处理85小时。 说明增长很快。

豆包大模型家族包含了13太保:

1 通用模型pro 2 通用模型lite 3 角色扮演模型 4 FunctionCall模型 5 向量化模型 6 视频生成模型 7 文生图模型 8 图生图模型 9 同声传译模型 10 音乐模型 11 语音识别模型 12 语音合成模型 13 声音复刻模型

通用模型pro的能力增长很快,在数学,专业知识,综合能力,大马,指令上进化很快。

TPM: 每分钟token数量。

豆包大模型的初始并发很牛逼, 80W的 TPM。

可以轻松满足 写作,智能座舱,文献翻译等场景。

升级了上下文窗口容量,达到了256K 。 即25.6万个字符,一般的对话智能分析完全没问题。

文生视频模型效果很震撼,但是豆包上没入口。

文生视频可以应用再 电商营销,动画教育,城市文旅,剧本创作上;

然后是一个非常漂亮的美女展示了 即梦和剪映使用豆包视频模型。

然后效果非常震撼,

让高适唱现代歌曲。

让古代画家跟你一起画画

学习纠错

数字人(音色克隆,智能翻译) 让你的在另外一个世界说话,而且会说很多国家的话。

还有一些比如智能抠图,营销话术生成,批量编辑图片,创造奇妙的视频。

创建好脚本,设置好视觉效果,即可生成视频,然后进行剪辑。

这个可以去试试,创作很方便。

豆包音乐模型很牛逼,输入提示词语,可以生成歌词,选择旋律,我晚上用这个创作歌曲哄我儿子睡觉,效果很好。

同声传译用来开跨国会议挺好的,可以实现实时翻译,音色精准,还可以复刻自己的声音。

然后介绍了火山引擎作为云计算平台上面的一些产品。

吴迪 企业AI转型

开篇总结的很好。

好用,低成本,容易落地 是AI大模型落地要保证。

然后答案是豆包,摆出了论据, 当前使用量大。

家族13太保。

有标杆的企业实践。

文生图模型升级了,可以进行复杂图文匹配,急速出图,对中文也理解透彻。

语音合成场景应用丰富。

视频生成是最炫的。

音乐生成很动人。

然后主推火山方舟, 高性能,安全,效果好,性价比高,容易落地 。

并发支持体系介绍,TPM , RPM 的指标高于竞品。

云计算底层算力强,调度算法优秀。

Context上下文缓存也作为亮点,

然后是安全的介绍: 身份认证,环境隔离,数据保密,信息无痕,操作可审计;日志全面而丰富。

然后是扩展性: 支持的知识库容量更大,处理速度更快,召回率更高;

叶柳 酷开AI实践

OTT 是 "Over The Top" 的缩写,指的是互联网公司越过运营商,发展基于开放互联网的各种视频及数据服务业务。它运营在用户已获得的网络之上,不需要网络运营商额外的商业或技术支撑。

酷开是一个在OTT领域很牛逼的公司。

AI解决了大屏行业的问题: 运营成本高,内容推荐智能,操作复杂;

通过智能海报,智能识别得到了大量的素材。 提高了材料的质量和效率,并且自动打标签。

智能短视频借助AI :

输入,视频理解,视频生成,输出,应用整个流程 加速了推广和覆盖用户的质量和效率。

智能推荐: 借助豆包提高了用户粘性和忠诚度。

这里感觉比较牛逼,放一个图,后面也可以复刻一下,智能推荐很重要,增加用户粘性的核武器。

智能管家可以识别各种方言,用到了实时翻译模型。

AI故事和绘本,使用了豆包的生文生图模型。

基于用户的数据创建了专属壁纸。

借助AI , 酷开在智能内容,新闻资讯,语音会话,外语练习,推荐算法这块推出了很多牛逼的功能和产品。

然后预言后面会是AI告诉发展的30年。

彭立人 仙剑AI实践

SFT : 监督式微调(Supervised Fine-Tuning):这是一种机器学习技术,特别是在自然语言处理领域,用于优化预训练的语言模型以适应特定的任务或数据集。在游戏领域的应用场景如下: 游戏中的智能 NPC:通过 SFT 技术对语言模型进行微调,可以让游戏中的 NPC 具有更智能的对话能力。例如,NPC 可以根据玩家的提问和游戏情境,给出更准确、更合理的回答,增加游戏的沉浸感和趣味性。 游戏剧情生成:利用 SFT 技术,可以根据游戏的设定和玩家的行为,自动生成游戏剧情。例如,在一些角色扮演游戏中,根据玩家的选择和角色的属性,生成不同的剧情分支和任务,让每个玩家都能体验到独特的游戏故事。 游戏攻略和提示系统:基于 SFT 的语言模型可以分析游戏数据和玩家行为,为玩家提供个性化的游戏攻略和提示。例如,根据玩家在游戏中的困难点和弱点,提供相应的策略和建议,帮助玩家更好地完成游戏。

在意图识别,情绪识别 豆包的AI服务降低了他们成本,比自建的成本要低很多。

一百万token/8毛钱

MRR (平均倒数排名), Hit Rate3 (排名前三) 豆包的向量模型数据表现比较好,向量数据库方面,vikingdb性能高于milvus

成本低于milvus.

然后也说了一些不足的地方。 在代码审查和文本纠错上,豆包的模型准确率不高。

张鑫 HIAgent平台

大模型上面架设好用的应用。

提示词+向量搜索 ;

列举了大模型落地的10个坑点。

扣子上有很多沉淀下来的Agent可以参考和使用。

是低代码+AI的组合。

就是提供了一个设计AI Agent的平台,提供了一些指导方法论,帮助各行业快速设计和落地自己的Agent.

罗浩 AI全栈云

大模型的应用需要云基础设施。

核心需求是算力,即GPU ,NPU等

资源管理,高性能,稳定性。

AI全栈云支撑了字节的爆款应用。

感觉就是字节有自己的云计算服务,叫火山引擎,有各种资源,性价比高,快来买吧。

对AI应用有全生命周期的观测和自愈。

然后有标杆企业的经典案例。

小结

通过参加这次巡展。 直观上,知道了几款AI的产品,并且下载下来使用了,体验不错。

然后依托于豆包的13个模型,各方都有真实的AI实践,以及展示。

为豆包大模型的使用埋下了影子。

可以探究一下当前服务的企业和产品,有哪些场景是可以跟豆包的13太保结合的,结合路径是怎样的。

原创不易,关注诚可贵,转发价更高!转载请注明出处,让我们互通有无,共同进步,欢迎沟通交流。

相关推荐
李福春7 个月前
AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用
java 技术管理
李福春1 年前
AIGC系列:1.chatgpt可以用来做哪些事情?
java 技术管理