介绍
百度智能云千帆AppBuilder平台提供了AppBuilder-SDK,开发者可使用SDK,快捷的开发功能,提升开发效率。
AppBuilder-SDK提供了完整的AI原生应用开发套件,包括丰富的开发组件 和应用示例代码。开发组件包括大模型组件、AI能力组件、基础云组件和软硬一体组件,满足各类高灵活度定制开发需求;应用示例代码提供了丰富灵活的应用框架最佳实践,基于业内主流大模型应用框架搭建,包含如支持知识增强的应用框架(RAG)、文本生成应用框架、具备思维链及工具使用能力的Agent框架、生成式数据分析框架等。
开源说明
AppBuilder-SDK已开源,欢迎广大开发者加入交流,详见AppBuilder-SDK开源说明。
语言及版本
AppBuilder-SDK目前只提供了 Python 语言的SDK,支持 Python >= 3.8版本。
功能列表
AppBuilder-SDK提供了完整的AI原生应用开发套件,包括丰富的开发组件 和应用示例代码 。各组件详细使用流程请前往组件中心。
开发组件
组件分类 | 组件名称 | 组件描述 | 接口文档 |
---|---|---|---|
大模型组件 | 多轮改写 | 多轮改写组件(QueryRewrite)是一款用于处理多轮对话和查询改写的组件。它主要用于理解和优化用户与机器人的交互过程,进行指代消解及省略补全。该组件支持不同的改写类型,可根据对话历史生成更准确的用户查询。 | 组件详情 |
大模型组件 | 相似问生成 | 相似问生成组件(SimilarQuestion)可以基于输入的问题,挖掘出与该问题相关的类似问题。广泛用于客服、问答等场景。 | 组件详情 |
大模型组件 | 自然语言转pandas | 自然语言转pandas组件(Nl2pandas)可以通过理解对表格信息的提问,生成对应语义的可执行Python代码,主要使用Pandas库。它可以用于基于表格的查询,问答等多种场景。 | 组件详情 |
大模型组件 | 标签抽取 | 标签抽取组件(TagExtraction)是一款高效的标签抽取组件,基于生成式大模型,专门用于从文本中提取关键标签。它适用于各种文本分析场景,如内容分类、关键词提取等。 | 组件详情 |
大模型组件 | 会话小结 | 会话小结组件(DialogSummary)可以基于生成式大模型对一段用户与坐席的对话生成总结,结果按{"诉求": "", "回应": "", "解决情况": ""}格式输出。适用于运营商、金融、汽车等多种场景的对话总结。 | 组件详情 |
大模型组件 | 口语化Query生成 | 口语化Query生成组件(OralQueryGeneration)可以基于输入文本生成与文档内容相关的Query。可用于增强文档索引等场景。 | 组件详情 |
大模型组件 | 复杂Query分解 | 复杂Query分解组件(QueryDecomposition)可以将已经确定为复杂问题的原始问题拆解为一个个简单问题。广泛应用在知识问答场景。 | 组件详情 |
大模型组件 | 复杂Query判定 | 复杂Query判定组件(IsComplexQuery)可以根据输入的提问进行初步的分类,区分简单问题和复杂问题,以便后续运用不同的处理流程处理。可应用于知识问答场景。 | 组件详情 |
大模型组件 | 风格转写 | 风格转写组件(StyleRewrite) 可以基于生成式大模型对文本的风格进行改写。支持多种文本风格,包括营销、客服、直播、激励及教学话术。 | 组件详情 |
大模型组件 | 风格写作 | 风格写作组件(StyleWriting)是一款基于生成式大模型进行文本创作的工具,支持多种风格,包括B站、小红书等,适用于编写文案、广告等多种场景。 | 组件详情 |
大模型组件 | 问答对挖掘 | 问答对挖掘(QAPairMining)可以基于输入文本内容,快速生成多个问题及对应答案,极大提高信息提炼的效率和准确性。广泛用于在线客服、智能问答等领域。 | 组件详情 |
大模型组件 | 阅读理解问答 | 阅读理解问答(MRC)组件是基于生成式大模型的阅读理解问答系统。该组件支持拒答、澄清、重点强调、友好性提升、溯源等多种功能,可用于回答用户提出的问题。 | 组件详情 |
大模型组件 | 空应用 | 空应用(Playground)是一款灵活的组件,允许用户自定义prompt模板并执行。它适用于各种场景,特别是在需要自定义输入模板和使用预训练模型进行交互的情况下。 | 组件详情 |
大模型组件 | GBI 选表 | GBI 选表,根据提供的多个 MySql 表名 以及 表名对应的描述信息,通过query 选择一个或多个最合适的表来回答该query。一般的试用场景是,当有数据库有多个表的时候,但是实际只有1个表能回答该query,那么,通过该能力将该表选择出来,用于后面的 问表环节。 | 组件详情 |
大模型组件 | GBI 问表 | GBI 问表,根据提供的 mysql 表的 schema 信息,生成对应问题的 sql 语句。 | 组件详情 |
AI能力组件 | 文本翻译-通用版 | 文本翻译组件(Translation)提供200+语种互译的在线文本翻译服务。支持术语定制功能,用户可对翻译结果进行干预,快速提高翻译质量。可广泛应用于移动端、PC网站、智能硬件等不同产品形态中,满足多领域、多场景的翻译需求。 | 组件详情 |
AI能力组件 | 文生图 | 文生图(Text2Image)基于文心大模型,可以根据用户输入的文本,自动创作不限定风格的图,为内容创作者提供灵感和高质量配图。 | 组件详情 |
AI能力组件 | 通用物体和场景识别-高级版 | 通用物体和场景识别组件(ObjectRecognition)可以识别超过10万类常见物体和场景,接口返回大类及细分类的名称。广泛适用于图像或视频内容分析、拍照识图等业务场景 | 组件详情 |
AI能力组件 | 通用文字识别-高精度版 | 通用文字识别组件(GeneralOCR)支持多场景、多语种、高精度的文字识别服务,对图片/文件全部文字内容进行检测识别。 | 组件详情 |
AI能力组件 | 菜品识别 | 菜品识别组件(DishRecognition)可以识别超过9千种菜品,可准确识别图片中的菜品名称、卡路里,适用于多种客户识别菜品的业务场景中。 | 组件详情 |
AI能力组件 | 地标识别 | 地标识别组件(LandmarkRecognition)可以识别12万中外著名地标、热门景点,可返回地标名称。 | 组件详情 |
AI能力组件 | 短语音识别-极速版 | 短语音识别(ASR)可以将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于手机语音输入、语音搜索、人机对话等语音交互场景。 | 组件详情 |
AI能力组件 | 短文本在线合成-基础音库 | 短文本在线合成组件(TTS)提供高度拟人、流畅自然的语音合成服务,将文本朗读出来,基础音库性价比更高。 | 组件详情 |
AI能力组件 | 短文本在线合成-精品音库 | 短文本在线合成(TTS)提供高度拟人、流畅自然的语音合成服务,将文本朗读出来,精品音库听感更逼真。 | 组件详情 |
AI能力组件 | 文本转语音 | 文本转语音组件(TTS)可以将输入的文本转化为音频文件。主要用于语音合成,适用于智能语音交互,自动语音播报等场景。 | 组件详情 |
AI能力组件 | 文档解析 | 文档解析组件(DocParser)可以用于文档内容解析,支持PDF、JPG、DOC、TXT、XLS、PPT等17种文档格式,可解析出文档版式、位置坐标、表格结构等内容。 | 组件详情 |
AI能力组件 | 文档切分 | 文档切分组件(DocSplitter)可以用于对文档进行段落切分。支持将文档划分为多个段落,便于后续处理和分析。 | 组件详情 |
AI能力组件 | 语义匹配 | 语义匹配组件(Matching)可以计算query与文本列表之间的相似度关系,并根据其进行排序。 | 组件详情 |
AI能力组件 | 向量计算 | 向量计算组件(Embedding)支持将文本转化为用数值表示的向量形式,用于文本检索、信息推荐、知识挖掘等场景。 | 组件详情 |
AI能力组件 | 表格抽取 | 表格抽取组件(ExtractTableFromDoc)是用于文档表格处理的组件,从文档中抽取表格。支持对文档表格大小进行限制,限制后自动进行拆分、跨页合并等处理;支持合并表格上文,提取的表格为Markdown格式。 | 组件详情 |
基础云组件 | 百度Elasticsearch | 百度Elasticsearch组件(BES)可以提供高性能、灵活扩展的向量与标量混合存储检索服务,支持多种索引类型和相似度计算方法,帮助提升召回率和检索效率,仅支持V7.x版本。 | 组件详情 |
基础云组件 | 向量检索 | 向量检索组件(Baidu ElasticSearch Retriever)基于一款Baidu ElasticSearch的内容检索组件,支持根据文本的向量的相似度进行内容检索。 | 组件详情 |
软硬一体组件 | 多模态AI模组LUCA系列 | 一款具备视觉、语音、文本、音频、视频采集识别和理解能力的多模态AI模组。 | - |
大模型组件 | Excel转图表 | Excel转图表(Excel2Figure)组件通过理解对表格信息的提问,生成对应语义的图表。 | 组件详情 |
AI能力组件 | 动物识别 | 动物识别 (Animal Recognition) 可用于识别一张图片,即对于输入的一张图片(可正常解码,且长宽比较合适),输出动物识别结果。 | 组件详情 |
AI能力组件 | 植物识别 | 植物识别(PlantRecognition),即对于输入的一张图片(可正常解码,且长宽比较合适),输出植物识别结果。 | 组件详情 |
AI能力组件 | 表格文字识别 | 表格文字识别 (Table OCR) 可支持识别图片/PDF格式文档中的表格内容,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息,全面覆盖各类表格样式,包括常规有线表格、无线表格、含合并单元格表格。同时,支持多表格内容识别。 | 组件详情 |
AI能力组件 | 手写体OCR识别 | 手写体OCR识别 (HandwriteOCR),图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上。 | 组件详情 |
AI能力组件 | 二维码识别 | 二维码识别 (QRcode OCR) 可对图片中的二维码、条形码进行检测和识别,返回存储的文字信息及其位置信息。 | 组件详情 |
AI能力组件 | 身份证混贴识别 | 身份证混贴识别(MixCardOCR),身份证混贴识别支持自动检测与识别身份证正反面在同一张图片上的场景,一次识别图片中身份证正反面所有字段。 | 组件详情 |
AI能力组件 | 文档矫正增强 | 文档矫正增强 (DocEnhance) 可对图片中的文件、卡证、票据等内容进行四角点检测定位,提取主体内容并对其进行矫正,同时可选图片增强效果进一步提升图片清晰度,达到主体检测矫正并增强的目的,提升图片整体质量。 | 组件详情 |
AI能力组件 | 图像内容理解 | 图像内容理解 (ImageUnderstand),输出理解图片后的文本信息。 | 组件详情 |
应用示例代码
应用类型 | 示例介绍 | 示例代码 |
---|---|---|
RAG知识问答应用 | 通过对本地简历库的简历进行解析、切片、创建索引,实现基于JD进行简历筛选,并对筛选的Top1简历进行总结的功能。 | 示例代码 |
文本生成应用 | 通过playground空应用对某商品创建介绍信息,并对商品输出问答对、小红书营销文案和标签抽取的功能。 | 示例代码 |
GBI应用 | 通过GBI SDK接口完成选表和问表的能力。 | 示例代码 |