flask celery hdfs 异步上传

在Flask和Celery环境下实现异步上传文件到HDFS(Hadoop Distributed File System)的功能,可以大大提高Web应用的性能和用户体验。以下是一个详细的步骤和代码示例,帮助你实现这一功能。

步骤 1: 环境准备

  1. 安装必要的库

    复制代码
    pip install Flask Celery hdfs pip install redis # 如果使用Redis作为消息代
  2. 设置Redis‌(Celery需要消息代理,这里以Redis为例)

    复制代码
    redis-server

步骤 2: 创建Flask应用和Celery任务

  1. 创建Flask应用

    复制代码
    from flask import Flask, request, jsonify app = Flask(__name__
  2. 配置Celery

    复制代码
    from celery import Celery 
    
    def make_celery(app): 
        celery = Celery( 
            app.import_name, 
            broker=app.config['CELERY_BROKER_URL'], 
            backend=app.config['CELERY_RESULT_BACKEND'] 
        ) 
        celery.conf.update(app.config) 
        TaskBase = celery.Task 
        class ContextTask(TaskBase): 
            abstract = True 
            def __call__(self, *args, **kwargs): 
                with app.app_context(): 
                    return TaskBase.__call__(self, *args, **kwargs) 
        celery.Task = ContextTask 
        return celery 
    
    app.config['CELERY_BROKER_URL'] = 'redis://localhost:6379/0' 
    app.config['CELERY_RESULT_BACKEND'] = 'redis://localhost:6379/0' 
    celery = make_celery(app)
  3. 定义上传任务

    复制代码
    from hdfs import InsecureClient 
    
    hdfs = InsecureClient('http://localhost:50070', user='your_username') 
    
    @celery.task() 
    def upload_to_hdfs(file_path, hdfs_path): 
        with open(file_path, 'rb') as f: 
            hdfs.write(hdfs_path, f, overwrite=True) 
        return f'File uploaded to {hdfs_path}'

步骤 3: 创建上传接口

  1. 定义Flask路由

    复制代码
    @app.route('/upload', methods=['POST']) 
    def upload(): 
        file = request.files['file'] if file: 
            file_path = 'temp/' + file.filename # 存储在本地临时位置 
            file.save(file_path) 
            hdfs_path = '/user/your_username/' + file.filename # HDFS路径 
            upload_to_hdfs.delay(file_path, hdfs_path) # 异步上传到HDFS 
            return jsonify({'status': 'success', 'message': 'Upload in progress'}) 
        return jsonify({'status': 'error', 'message': 'No file provided'}), 400

步骤 4: 运行应用和Celery worker

  1. 运行Flask应用

    复制代码
    FLASK_APP=your_application.py flask run --port=5000

    其中your_application.py是你的Flask应用文件。

  2. 启动Celery worker

    复制代码
    celery -A your_application.celery worker --loglevel=inf

    同样,your_application.py是你的Flask应用文件。

步骤 5: 测试上传功能

你可以使用Postman或者curl来测试上传接口:

复制代码
curl -X POST -F "file=@path_to_your_file" http://localhost:5000/uploa

确保替换path_to_your_file为你的文件路径。

以上步骤和代码示例将帮助你在Flask和Celery环境下实现异步上传文件到HDFS的功能。

相关推荐
创世宇图2 分钟前
【Python工程化实战】Kubernetes 中 Python 应用的优雅启停与健康检查:零停机滚动更新实战
python·云原生·kubernetes·优雅停机
zhiSiBuYu051739 分钟前
重排序(Rerank)提升检索准确率实战指南
开发语言·python·算法
MageGojo42 分钟前
集成企业工商信息查询API:从在线调试到生产级调用实战
python·调试·rest api·api集成·企业信息查询
huangjiazhi_1 小时前
Python3.14编写文件服务器
python
郭梧悠1 小时前
算法:有效的括号
python·算法·leetcode
佛珠散了一地1 小时前
ONNX Runtime GPU 推理配置指南
python
派葛穆2 小时前
Python-pip切换镜像源
开发语言·python·pip
CTA终结者2 小时前
2026年AI量化提效,工具重点要按阶段调整
人工智能·python
xxie1237942 小时前
Python 闭包:函数嵌套的 “状态捕获” 机制
开发语言·python
c_lb72882 小时前
最新AI量化提效,交易认知和技术实现要接上
人工智能·python