AI Studio星河社区生产力实践:基于文心一言快速搭建知识库问答

还在寻找基于文心一言搭建本地知识库问答的方案吗?AI Studio星河社区带你实战演练(支持私有化部署)!

相信对于大语言模型(LLM)有所涉猎的朋友,对于"老网红"知识库问答不会陌生。自从大模型爆火后,开发者都希望尽快进行开发实战,企业都希望尽快在产品中集成LLM的能力,结合业务快速落地,那最直接的方式就是构建知识库问答。本项目由AI Studio星河社区开发者「SWHL」创作并发布体验应用,应用中使用AI Studio SDK(文末获取文档)提供的能力完成文心一言与向量检索增强的结合,与此同时,开发者「SWHL」提供的开源项目还支持本地私有化部署的版本,助力个人和企业完成知识问答系统搭建。

项目亮点

1、除大语言模型接口需要单独部署外,其他部分均可使用CPU

2、整个项目模块化,不依赖lanchain库,各个部分都可以轻松替换,代码简单易懂

3、WebUI向量检索Log可视化

4、支持接入多个LLM模型

5、支持本地私有化部署

应用体验

应用参数解读:

  • max_length:生成结果时的最大token数
  • top_p:用于控制模型生成文本时,选择下一个单词的概率分布的范围。具体来说,当使用top_p参数时,模型将考虑累积概率分布中概率之和最大的最小集合中的所有单词,并在其中选择下一个单词
  • temperature:用于调整模型生成文本时的创造性程度,较高的temperature将使模型更有可能生成新颖、独特的文本,而较低的温度则更有可能生成常见或常规的文本
  • Search Top_K:从文档向量数据库中召回的前K个相关内容,用于和问题拼接为完整内容送到大模型中,可选值有5,10, 15

工作流程

1、解析文档并存入数据库

2、检索并回答问题

搭建知识库问答应用

  • Fork该项目
  • 启动进入线上开发环境

选择CPU环境即可

AI Studio星河社区每周均可免费获得一定数量算力

  • 查看文件进行开发
  • 本地私有化部署

创作者已将该项目进行开源,有私有化部署需求的可移步至该项目Github,获取代码文件进行部署。项目作者:SWHL,RapidAI开源组织成员,日常研究方向为大模型落地和CV相关,包括OCR和目标检测等方向。

  1. 作者主页

https://github.com/SWHL

  1. RapidAI开源组织主页

https://github.com/RapidAI

  1. 该项目Github

https://github.com/RapidAI/Knowledge-QA-LLM

AI Studio星河社区已上线SDK开发工具,支持文心一言、Embedding等能力的高效使用,搜索飞桨AI Studio小程序查看SDK开发工具使用文档。

相关推荐
无风听海4 分钟前
神经网络之样本方差的无偏估计
人工智能·神经网络·概率论
Francek Chen12 分钟前
【HarmonyOS 6 特别发布】鸿蒙 6 正式登场:功能升级,构建跨设备安全流畅新生态
人工智能·华为·harmonyos·harmonyos 6
kalvin_y_liu14 分钟前
【“具身智能”AI烹饪机器人系统 - 外委研发课题清单】
人工智能·具身智能
是Dream呀15 分钟前
PRCV 2025:文本何以成为 AGI 的必经之路?
图像处理·人工智能·aigc·agi·多模态·合合信息
王嘉俊92520 分钟前
HarmonyOS 分布式与 AI 集成:构建智能协同应用的进阶实践
人工智能·分布式·harmonyos
StarPrayers.20 分钟前
CNN 模型搭建与训练:PyTorch 实战 CIFAR10 任务
人工智能·pytorch·cnn
赋创小助手21 分钟前
实测对比 32GB RTX 5090 与 48GB RTX 4090,多场景高并发测试,全面解析 AI 服务器整机性能与显存差异。
运维·服务器·人工智能·科技·深度学习·神经网络·自然语言处理
阿水实证通21 分钟前
能源经济选题推荐:可再生能源转型政策如何提高能源韧性?基于双重机器学习的因果推断
人工智能·机器学习·能源
掘金安东尼35 分钟前
大模型嵌入浏览器,Atlas 和 Gemini 将带来怎样的变革?
人工智能
亚马逊云开发者40 分钟前
基于Amazon Bedrock的TwelveLabs Marengo Embed 2.7多模态搜索系统
人工智能