浅谈生成式AI的文化意识——听亚马逊 CTO Werner Vogels演讲后感

在不久前的全球云计算科技前沿盛会------re:Invent 2023大会上,Werner Vogels 博士,亚马逊云科技的副总裁兼首席技术官第十二次在 re:Invent 亮相。在主题演讲中,他提到了生成式 AI 将逐渐具备文化意识这个点非常令人感兴趣。

生成式AI的文化意识是指人工智能系统具有对不同文化背景、价值观、传统习俗以及文化差异的理解和适应能力。这种文化意识可以让AI系统更好地理解和回应不同文化环境下的用户需求,并在交流和创造中考虑到多元化的人文因素。

一、生成式AI的文化流利性

生成式AI的文化流利性是指AI系统在生成内容或进行创作时,能够以流利、自然的方式表达和呈现特定文化的语言、风格和特征。它能够适应不同文化的表达方式,使生成的内容更加贴近目标文化的习惯、规范和口音。

大语言模型要想触达全球用户,必须达到与人类自身相同的文化流利性。Werner Vogels 博士提到近几个月开始出现一些非西方语境的大语言模型,比如用阿拉伯语和英语数据训练的 Jais、中英双语模型 Yi-34B,更符合中文语境的文心千帆以及用大量日语网络语料库训练的 Japanese-large-lm。这些迹象表明,具有文化准确性的非西方模型将向数亿人提供生成式 AI,其影响将会涉及教育、医疗等方方面面。除了特定语言,文化流利性还将模拟特定文化的风格和口音,使生成的内容更贴近目标文化。通过学习语言的语调、语速、语音特点和当地方言等特征,生成具有特定文化风格的内容,这一点值得期待!

二、生成式AI的文化创造力

生成式AI的文化创造力是指AI系统在创作或生成文化相关内容时,能够展现出独立思考、独特观点和创新想法的能力,从而产生与传统文化不同且具有独特价值的作品。

生成式AI通过学习大规模的文化数据,包括文本、图像、音频等,能够对不同文化的特点和风格进行理解。通过深入学习文化的语言、风俗、艺术表达方式等方面的知识,AI系统能够从不同文化中汲取灵感和启发,形成自己的创造力。比如下图Midjourney Model 5.2生成的水墨画《奔马图》

生成式AI在生成内容时可以进行创造性的组合。通过将不同文化元素、风格和主题进行新颖和独特的组合,能够产生跨文化融合和创新的作品。这种创造性的组合可以打破传统的文化束缚,创造出与众不同的文化表达形式。

三、生成式AI的文化敏感性

生成式AI的文化敏感性是指AI系统在生成内容或进行创作时,能够充分考虑不同文化背景、价值观和敏感性,避免产生冒犯、歧视或不当的作品,避免触及用户的文化禁忌,以尊重和包容各种文化。

这里博士还举了个例子:佐治亚理工学院(Georgia Institute of Technology)的研究人员在今年早些时候发布的论文中证明,即使向一个大语言模型提供明确提及伊斯兰祈祷词的阿拉伯语提示词,生成的回复依然是建议与朋友们一起喝酒,而喝酒在伊斯兰文化中是不当之举。这种情况在很大程度上与可用训练数据有关。目前被用于训练众多大语言模型的 Common Crawl 数据集大约有 46% 的内容是英语,而且无论何种语言,更大比例的可用内容以西方文化为基础(明显倾向于美国文化)。如果将相同的提示词输入用阿拉伯语文本预训练且专门生成阿拉伯语响应的模型,就会得到更符合文化背景的回复,比如建议喝茶或咖啡。

作为生成式AI的研究人员,为了提升文化敏感性,在研究时数据集应该尽可能涵盖不同文化背景的样本,避免集中于某一特定文化视角。通过使用广泛和多元的数据集,AI系统可以学习到不同文化的表达方式和特征,减少对特定文化的偏见。

文化和语言并非完全相同,一个模型即便能给出最完美的翻译,也未必具有文化意识。随着无数历史和经验被融入模型,我们将会看到大语言模型开始形成更广泛的世界性视角。可以相信在未来几年里,文化将在技术的设计、部署和使用方式中发挥至关重要的作用,其影响将在生成式 AI 中体现得淋漓尽致。

另外2023 re:Invent 2023 下一站 GenAI @活动即将在各个城市开启,所有的开发者都可以登车体验包括 Amazon PartyRock、Amazon Q、Amazon CodeWhisperer 等产品在内的丰富实践,并在旅程中与技术专家、开发者探讨AI的更多创新与未来的可能性。下一站 GenAI @ Let's 构!

相关推荐
Debroon3 分钟前
RuleAlign 规则对齐框架:将医生的诊断规则形式化并注入模型,无需额外人工标注的自动对齐方法
人工智能
羊小猪~~10 分钟前
神经网络基础--什么是正向传播??什么是方向传播??
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
AI小杨11 分钟前
【车道线检测】一、传统车道线检测:基于霍夫变换的车道线检测史诗级详细教程
人工智能·opencv·计算机视觉·霍夫变换·车道线检测
晨曦_子画15 分钟前
编程语言之战:AI 之后的 Kotlin 与 Java
android·java·开发语言·人工智能·kotlin
道可云17 分钟前
道可云人工智能&元宇宙每日资讯|2024国际虚拟现实创新大会将在青岛举办
大数据·人工智能·3d·机器人·ar·vr
人工智能培训咨询叶梓26 分钟前
探索开放资源上指令微调语言模型的现状
人工智能·语言模型·自然语言处理·性能优化·调优·大模型微调·指令微调
zzZ_CMing26 分钟前
大语言模型训练的全过程:预训练、微调、RLHF
人工智能·自然语言处理·aigc
newxtc27 分钟前
【旷视科技-注册/登录安全分析报告】
人工智能·科技·安全·ddddocr
成都古河云28 分钟前
智慧场馆:安全、节能与智能化管理的未来
大数据·运维·人工智能·安全·智慧城市
UCloud_TShare31 分钟前
浅谈语言模型推理框架 vLLM 0.6.0性能优化
人工智能