autoDL安装Open-WebUi+Rag本地知识库问答+Function Calling

基础环境搭建

  1. open-webui安装
arduino 复制代码
pip install open-webui
  1. ollama在线安装
arduino 复制代码
curl -fsSL https://ollama.com/install.sh | sh

2.1. 将模型下载地址改到数据盘

bash 复制代码
vim /etc/profile
export OLLAMA_MODELS=/root/autodl-tmp/models
source /etc/profile

2.2. 启动ollama

sql 复制代码
ollama start

3. 安装deepseek-r1:14b模型

复制代码
ollama pull deepseek-r1:14b
  1. Embedding模型下载
arduino 复制代码
ollama pull nomic-embed-text
  1. 查看模型下载情况

    ollama list

Open-WebUi调用

首先需要设置离线环境,避免Open-WebUI启动时自动进行模型下载:

export HF_HUB_OFFLINE=1

  1. Open-WebUi启动
arduino 复制代码
open-webui serve
  1. 本地8080端口访问

需要建立链接隧道,autodl参考这里www.autodl.com/docs/visdom...

  1. Rag本地知识库问答

按照如下步骤操作后,即可上传文档,进行基础本地知识库问答

  1. 外部工具调用Function Calling

案例:连接本地MySQL数据库进行数据查询

4.1. 安装mysql

sql 复制代码
-- 创建mysql数据库
apt install mysql-server


-- 启动mysql
mysqld &
mysql

-- 初始化密码
ALTER USER 'root'@'localhost' IDENTIFIED BY '123';

-- 退出
exit;

-- 再次进入
mysql -u root -p

-- 创建数据库
CREATE DATABASE school;
USE school;

-- 创建表结构
CREATE TABLE students_scores (
id INT AUTO_INCREMENT PRIMARY KEY,
name VARCHAR(50),
course1 INT,
course2 INT,
course3 INT
);

-- 插入数据
INSERT INTO students_scores (name, course1, course2, course3)
VALUES
('学生1', 85, 92, 78),
('学生2', 76, 88, 91),
('学生3', 90, 85, 80),
('学生4', 65, 70, 72),
('学生5', 82, 89, 95),
('学生6', 91, 93, 87),
('学生7', 77, 78, 85),
('学生8', 88, 92, 91),
('学生9', 84, 76, 80),
('学生10', 89, 90, 92);

-- 需要刷新身份验证,使得其他库(如pymysql)可以通过密码验证登录:
ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY '123';

4.2. 编写外部工具

python 复制代码
import pymysql
import json
from fastapi import Request
from open_webui.models.users import Users


class Tools:
    def __init__(self):
        pass

    async def sql_inter(
        self,
        sql_query: str,
        __request__: Request,
        __user__: dict,
        __event_emitter__=None,
    ) -> str:
        """
        用于获取school数据库中各张表的有关相关信息。

        :param sql_query: 字符串形式的SQL查询语句,用于执行对MySQL数据库中的查询
        :param __request__: HTTP 请求对象(来自 FastAPI)
        :param __user__: 用户信息(可以用于个性化或记录请求)
        :param __event_emitter__: 事件发射器,用于将实时状态更新发送到前端
        :return: SQL 查询结果的 JSON 字符串
        """
        # Step 1. 通知用户正在执行数据库查询
        await __event_emitter__(
            {
                "type": "status",
                "data": {"description": "正在查询数据库...", "done": False},
            }
        )

        try:
            # Step 2. 连接 MySQL 数据库
            connection = pymysql.connect(
                host="localhost",  # 数据库地址
                user="root",  # 数据库用户名
                passwd="123",  # 数据库密码
                db="school",  # 数据库名
                charset="utf8",  # 字符集选择utf8
            )

            # Step 3. 执行 SQL 查询
            with connection.cursor() as cursor:
                cursor.execute(sql_query)
                results = cursor.fetchall()

            # Step 4. 格式化查询结果
            results_json = json.dumps(results, ensure_ascii=False)

            # Step 5. 通知用户查询完成
            await __event_emitter__(
                {
                    "type": "status",
                    "data": {"description": "数据库查询完成", "done": True},
                }
            )

            # Step 6. 返回查询结果
            return f"查询结果: {results_json}"

        except Exception as e:
            # Step 7. 如果发生错误,通知用户
            await __event_emitter__(
                {
                    "type": "status",
                    "data": {"description": f"发生错误: {str(e)}", "done": True},
                }
            )
            # 返回错误信息
            return f"获取数据库查询数据时发生错误:{str(e)}"

        finally:
            # Step 8. 关闭数据库连接
            if connection:
                connection.close()

4.3. 对话中打开数据库查询工具

相关推荐
水如烟2 小时前
孤能子视角:“意识“的阶段性回顾,“感质“假说
人工智能
Carl_奕然2 小时前
【数据挖掘】数据挖掘必会技能之:A/B测试
人工智能·python·数据挖掘·数据分析
旅途中的宽~2 小时前
《European Radiology》:2024血管瘤分割—基于MRI T1序列的分割算法
人工智能·计算机视觉·mri·sci一区top·血管瘤·t1
岁月宁静2 小时前
当 AI 越来越“聪明”,人类真正的护城河是什么:智商、意识与认知主权
人工智能
ghie90902 小时前
基于MATLAB的TLBO算法优化实现与改进
开发语言·算法·matlab
恋爱绝缘体12 小时前
2020重学C++重构你的C++知识体系
java·开发语言·c++·算法·junit
wuk9982 小时前
VSC优化算法MATLAB实现
开发语言·算法·matlab
CareyWYR2 小时前
每周AI论文速递(260105-260109)
人工智能
智能相对论2 小时前
CES深度观察丨智能清洁的四大关键词:变形、出户、体验以及生态协同
大数据·人工智能
齐齐大魔王2 小时前
Pascal VOC 数据集
人工智能·深度学习·数据集·voc