Dify知识库下载小程序

一、Dify配置

1.查看或创建知识库的API

二、下载程序配置

1. 安装依赖resquirements.txt

复制代码
######requirements.txt#####
flask==2.3.3
psycopg2-binary==2.9.9
requests==2.31.0
python-dotenv==1.0.0

#####安装依赖
pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

2. 主程序代码app.py

复制代码
##app.py

from flask import Flask, render_template, jsonify, Response
import requests
import os
from dotenv import load_dotenv
import io
import zipfile
import urllib.parse
from config import API_KEY, BASE_URL

app = Flask(__name__)

@app.route('/')
def index():
    return render_template('index.html')

@app.route('/api/datasets')
def get_datasets():
    headers = {
        'Authorization': f'Bearer {API_KEY}',
        'Content-Type': 'application/json'
    }
    response = requests.get(
        f'{BASE_URL}/v1/datasets?page=1&limit=20',
        headers=headers
    )
    
    if response.status_code == 200:
        data = response.json()
        datasets = [{'id': item['id'], 'name': item['name']} for item in data.get('data', [])]
        return jsonify(datasets)
    return jsonify({'error': '获取知识库列表失败'}), response.status_code

@app.route('/api/files/<dataset_id>')
def get_files(dataset_id):
    headers = {
        'Authorization': f'Bearer {API_KEY}',
        'Content-Type': 'application/json'
    }
    response = requests.get(
        f'{BASE_URL}/v1/datasets/{dataset_id}/documents',
        headers=headers
    )
    
    if response.status_code == 200:
        data = response.json()
        files = []
        for item in data.get('data', []):
            file_id = item['id']
            file_name = item.get('data_source_detail_dict', {}).get('upload_file', {}).get('name', file_id)
            files.append({'id': file_id, 'name': file_name})
        return jsonify(files)
    return jsonify({'error': '获取文件列表失败'}), response.status_code

def download_single_file(dataset_id, document_id):
    headers = {
        'Authorization': f'Bearer {API_KEY}',
        'Content-Type': 'application/json'
    }
    
    # 获取文件下载地址
    response = requests.get(
        f'{BASE_URL}/v1/datasets/{dataset_id}/documents/{document_id}/upload-file',
        headers=headers
    )
    
    if response.status_code == 200:
        download_url = response.json().get('download_url')
        if download_url:
            # 拼接完整的下载URL
            full_url = f'{BASE_URL}{download_url}'
            file_response = requests.get(full_url, headers=headers)
            if file_response.status_code == 200:
                return file_response.content
    return None

@app.route('/api/download/<dataset_id>/<document_id>')
def download_file(dataset_id, document_id):
    content = download_single_file(dataset_id, document_id)
    if content:
        return Response(
            content,
            mimetype='application/octet-stream',
            headers={'Content-Disposition': 'attachment'}
        )
    return jsonify({'error': '文件下载失败'}), 400

@app.route('/api/download-dataset/<dataset_id>')
def download_dataset(dataset_id):
    # 获取文件列表
    headers = {
        'Authorization': f'Bearer {API_KEY}',
        'Content-Type': 'application/json'
    }
    response = requests.get(
        f'{BASE_URL}/v1/datasets/{dataset_id}/documents',
        headers=headers
    )
    
    if response.status_code != 200:
        return jsonify({'error': '获取文件列表失败'}), response.status_code
    
    files = []
    for item in response.json().get('data', []):
        file_id = item['id']
        file_name = item.get('data_source_detail_dict', {}).get('upload_file', {}).get('name', file_id)
        files.append({'id': file_id, 'name': file_name})
    
    # 创建ZIP文件
    memory_file = io.BytesIO()
    with zipfile.ZipFile(memory_file, 'w') as zf:
        for file in files:
            content = download_single_file(dataset_id, file['id'])
            if content:
                zf.writestr(file['name'], content)
    
    memory_file.seek(0)
    return Response(
        memory_file.getvalue(),
        mimetype='application/zip',
        headers={'Content-Disposition': f'attachment;filename=dataset_{dataset_id}.zip'}
    )

if __name__ == '__main__':
    app.run(debug=True)

3. 配置知识库的Base_URL和API_key

配置dify知识库和数据库鉴权信息,如下:

复制代码
# 知识库API配置
API_KEY = 'dataset-YNXAxOyNucHoyzVUN6MlPJXT'
BASE_URL = 'http://10.1.140.33'

三、启动服务

#python3 app.py

访问 http://127.0.0.1:5000/ 进行下载文件或整个知识库

相关推荐
说私域1 天前
短视频私域流量池的变现路径创新:基于AI智能名片链动2+1模式S2B2C商城小程序的实践研究
大数据·人工智能·小程序
毕设源码-邱学长1 天前
【开题答辩全过程】以 基于微信小程序的松辽律所咨询系统的设计与实现为例,包含答辩的问题和答案
微信小程序·小程序
+VX:Fegn08951 天前
计算机毕业设计|基于springboot + vue物流配送中心信息化管理系统(源码+数据库+文档)
数据库·vue.js·spring boot·后端·小程序·课程设计
说私域1 天前
B站内容生态下的私域流量运营创新:基于AI智能名片链动2+1模式与S2B2C商城小程序的融合实践
人工智能·小程序·流量运营
计算机毕设指导61 天前
基于微信小程序的钓鱼论坛系统【源码文末联系】
java·spring boot·mysql·微信小程序·小程序·tomcat·maven
qq_12498707531 天前
基于微信小程序的宠物交易平台的设计与实现(源码+论文+部署+安装)
java·spring boot·后端·微信小程序·小程序·毕业设计·计算机毕业设计
计算机毕设指导62 天前
基于微信小程序的精致护肤购物系统【源码文末联系】
java·spring boot·微信小程序·小程序·tomcat·maven·intellij-idea
sheji34162 天前
【开题答辩全过程】以 基于微信小程序的在线学习系统为例,包含答辩的问题和答案
学习·微信小程序·小程序
头发还在的女程序员2 天前
小剧场短剧影视小程序源码分享,搭建自己的短剧小程序
人工智能·小程序·短剧·影视·微剧
qq_12498707533 天前
基于springboot归家租房小程序的设计与实现(源码+论文+部署+安装)
java·大数据·spring boot·后端·小程序·毕业设计·计算机毕业设计