亚马逊云科技在re:Invent 2023上宣布推出Amazon Bedrock更多模型选择和强大功能,帮助客户更轻松地构建和规模化针对其业务定制的生成式AI应用程序。
Amazon Bedrock是一项全面托管的服务,用户可轻松访问来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI和亚马逊云科技的多种行业领先大语言模型和其他模型,以及客户构建生成式AI应用程序所需的广泛的功能,包括确保隐私和安全的同时简化开发。
此次发布进一步降低了生成式AI应用的门槛------为客户提供了更多行业领先的模型选择和评估模型新功能,以简化客户使用相关和专有数据定制模型的方式;提供自动执行复杂任务的工具;并为客户配备了提供负责任地构建和部署应用程序的保障。Amazon Bedrock的这些新功能为千行百业、各种规模的企业应用生成式AI的方式都带来改变,助力企业激发创新并重塑客户体验。
Anthropic、Cohere、Meta和Stability AI的最新模型
以及亚马逊Titan的新增功能为客户提供了更多模型选择
没有一个模型适合所有场景。模型的功能、价格和性能都不尽相同。客户需要轻松访问各种模型选择,多次尝试和切换模型,最终选出最匹配需求的模型。
借助Amazon Bedrock,客户可以利用最新版本的模型快速创新,包括新推出的Anthropic Claude 2.1和Meta Llama 2 70B以及最近推出的Stability AI Stable Diffusion XL 1.0、Meta Llama 2 Chat 13B、Cohere Command Light、Cohere Embed English和Cohere Embed多语言模型------全部可通过API访问。除了Amazon Titan Text Embeddings和Amazon Titan Text模型(现已全面可用)之外,亚马逊云科技还提供了Titan Multimodal Embeddings和Amazon Titan Image Generator为客户使用模型构建生成式AI应用程序提供更多选择和灵活性。Amazon Titan模型由Amazon Bedrock独家提供,由亚马逊云科技在适用于各种用例的大型且多样化的数据集上创建和预训练,并内置对负责任地使用AI的支持。如果正式可用的Amazon Titan模型或其输出的内容侵犯了第三方版权,亚马逊云科技将对使用这些模型的客户进行赔偿。
- Amazon Bedrock上的Anthropic Claude 2.1:
Anthropic是一家从事AI安全和科研的公司,致力于构建可靠、可解释和可控的AI系统。Anthropic已将其最新版本的语言模型Claude 2.1引入Amazon Bedrock。Claude 2.1提供了长达200,000个token的上下文窗口,并且提高了长文档的准确性。客户可以处理文本密集型文档,例如财务报表和内部数据集。Claude 2.1能够总结和对比文档、进行问答等。Anthropic报告称,与此前模型相比,Claude 2.1在开放式对话中的错误陈述减少了50%,错误陈述率减少了一半。
- Amazon Bedrock上的Meta Llama 2 70B:
Llama 2是Meta的下一代语言模型。Llama 2的训练数据比Llama 1多40%,上下文长度是Llama 1的两倍。除了最近发布的Llama 2 130亿参数模型之外,Llama 2 700亿参数模型也已在Amazon Bedrock上提供。Llama 2 Chat建立在预训练的Llama模型之上,通过指令数据集和超过100万条人工注释进行调优,针对对话场景进行了优化。这些模型在多个外部基准测试中的表现卓越,包括推理、编码、熟练程度和知识测试,并在Amazon Bedrock上提供了极高的性能价格组合。
- 新的Amazon Titan Image Generator现已推出预览版:
Amazon Titan Image Generator可帮助广告、电子商务、媒体和娱乐等行业的客户通过使用自然语言提示生成高质量、逼真的图像或增强现有图像,以便以低成本快速构思和大量迭代图像。这一模型可以理解复杂的提示词并生成相关图像,且准确度较高很少失真,也不易含有有害内容,减少错误信息传播。
客户可以在Amazon Bedrock控制台中使用该模型,在配置维度参数并指定模型应生成变化图像的数量之前,可以直接输入自然语言提示来生成图像或上传图像进行自动编辑。在编辑过程中,客户可以隔离图像的某些部分以添加或替换细节(例如,将冲浪板插入海滩场景或将汽车广告背景中的高山替换为森林),或者他们可以使用其他与原作风格相同的细节扩展图像的边界。为了兑现亚马逊云科技今年早些时候在白宫做出的承诺,所有Amazon Titan生成的图像都包含不可见水印,以通过建立严谨的识别AI生成图像的机制来帮助减少错误信息的传播,促进AI技术的安全、可靠和透明发展。亚马逊云科技是首批广泛发布内置隐形水印的模型提供商之一,这些水印集成到输出的图像中,并设计为拒绝更改。
- 新的Amazon Titan Multimodal Embeddings现已正式可用:
Amazon Titan Multimodal Embeddings可帮助客户为最终用户提高多模态搜索和推荐体验,让输出结果更准确且与上下文相关。模型可以将图像和短文本转换为embedding数字表示形式,使模型能够轻松理解语义以及数据之间的关系。最终用户可以使用图像和文本提示的任意组合进行搜索查询。该模型将为搜索查询生成嵌入,并将它们与已有的嵌入相匹配,以产生更相关的搜索和推荐结果。
例如,拥有数亿张图像的图库摄影公司可以使用该模型来增强其搜索功能,这样用户就可以使用短语、图像或图像和文本的组合来搜索图像(例如,"我要和这张照片类似的图像,但天空是晴朗的")。一般情况下,使用该模型生成向量非常适合于需要高准确度和快速响应的搜索场景。然而,客户也可以生成更小的维度来优化速度和性能。Amazon Titan Text Embeddings模型可以将词语、短句、长文档等文本输入转化为嵌入(embeddings),用于搜索和个性化推荐等场景,这一模型加入了Amazon Titan Text Embeddings。
新功能可帮助客户高效评估、比较和选择
最适合其应用场景和业务需求的模型
如今,企业拥有广泛的模型选项来为其生成式AI应用程序提供支持。在具体应用场景中,为了在准确性和性能之间取得适当的平衡,企业必须有效地比较模型并根据其首选指标找到最佳选择。为了比较模型,企业必须首先花几天时间确定基准、设置评估工具并运行评估,所有这些都需要深厚的数据科学专业知识。此外,这些测试无法用于主观标准的评估(例如,品牌声量、相关性和风格),因为主观标准需要通过繁琐、耗时的人工审核进行判断。对于每个新场景模型,这些比较所需的时间、专业知识和资源使企业望而却步,从而限制了他们对生成式AI的使用。
Amazon Bedrock中的模型评估功能现已推出预览版,可帮助客户使用自动或人工评估来评估、比较和选择适合其特定应用场景的最佳模型。在Amazon Bedrock控制台中,客户可以选择他们想要针对给定任务(例如问答或内容摘要)进行比较的模型。如需自动评估,客户可以选择预定义的评估标准(例如准确性、鲁棒性和是否含有有害内容)并上传自己的测试数据集或从内置的公开数据集中进行选择。
对于需要复杂判断的主观标准或细微内容,客户只需点击几下即可轻松设置基于人工的评估工作流程。这些工作流程利用客户的内部员工队伍或使用亚马逊云科技提供的员工队伍来评估模型响应。在基于人的评估过程中,客户可以定义特定的指标(例如,相关性、风格和品牌声量)。客户完成设置后,Amazon Bedrock就会运行评估并生成报告,以便客户可以轻松了解模型在关键标准上的表现,并可以做出最佳权衡,从而快速选择最适合其应用场景的模型。