python 多线程实战(不断更新)

1.多线程来读取多个文件,缩减运行时间,提高效率

以读取json文件为例,

单个线程读取文件

python 复制代码
import time
import os
import json
from pathlib import Path

class ReadNumerousFile:
    def __init__(self, file_path):
        # 文件路径
        self.file_path = file_path

    def read_file(self, file_li):
        # os.path.join() 替换成 Path().joinpath()
        for file in file_li:
            print(Path().joinpath(self.file_path, file))
            with open(Path().joinpath(self.file_path, file), 'r', encoding='utf-8') as f:
                josn_obj = json.load(f)
                if josn_obj:
                    print(josn_obj[0])


if __name__ == '__main__':
    start = time.time()
    source_path = r'D:\File\EVERY_MONTH_TASK\2023\tech_file\outputs'
    file_list = os.listdir(source_path) # 获取路径下文件列表
    if file_list:
        r_obj = ReadNumerousFile(source_path)
        r_obj.read_file(file_list)
    end = time.time()
    print('程序运行了%s' % (end - start))

程序运行了0.9743776321411133

多线程读取文件

python 复制代码
import time
import os
import json
from pathlib import Path
import threading


class ReadNumerousFile:
    def __init__(self, file_path):
        self.file_path = file_path

    def read_file(self, file_li):
        # os.path.join() 替换成 Path().joinpath()
        for file in file_li:
            print(Path().joinpath(self.file_path, file))
            with open(Path().joinpath(self.file_path, file), 'r', encoding='utf-8') as f:
                josn_obj = json.load(f)
                if josn_obj:
                    print(josn_obj[0])


if __name__ == '__main__':
    start = time.time()
    source_path = r'D:\File\EVERY_MONTH_TASK\2023\tech_file\outputs'
    file_list = os.listdir(source_path)
    n = 300  # 每个线程处理的文件数
    threads = []  # 线程列表
    if file_list:
        list_all = [file_list[i:i + n] for i in range(0, len(file_list), n)]
        # 按300来切分文件列表
        r_obj = ReadNumerousFile(source_path)
        for part_file_list in list_all:
            t = threading.Thread(target=r_obj.read_file, args=(part_file_list,))  # 创建线程
            threads.append(t)  # 加入线程列表
            t.start()  # 启动线程
    for thr in threads:
        thr.join()  # 等待所有子线程结束
    end = time.time()
    print('程序运行了%s秒' % (end - start))

程序运行了0.4763674736022949

对比两种方式的运行时间,明显多线程时间快了1倍

相关推荐
计算机徐师兄2 分钟前
Python基于Django的汉语文本阅读难度分级系统(附源码,文档说明)
python·机器学习·django·汉语文本阅读难度分级系统·python文本阅读难度分级·文本阅读难度分级系统·汉语文本阅读难度分级
路弥行至3 分钟前
linux运行脚本出现错误信息 /bin/bash^M: bad interpreter解决方法
linux·运维·开发语言·经验分享·笔记·其他·bash
一直不明飞行4 分钟前
C++ pari使用的两个注意事项
开发语言·c++
LinuxGeek10244 分钟前
从Centos-7迁移和升级到(银河麒麟)Kylin V7的教程
python·centos·kylin
烟锁池塘柳07 分钟前
【Anaconda】修改 Conda 环境存储路径的几种方法(详细教程)
python·pycharm·conda
wefly20178 分钟前
无需安装的 M3U8 在线播放器,快速实现 HLS 流预览与调试
java·开发语言·python·开发工具
飞Link8 分钟前
深度解析:建模动作序列(Action Sequence Modeling)的实战指南
开发语言·python·数据挖掘
CoderCodingNo8 分钟前
【GESP】C++六级/五级练习题 luogu-P1323 删数问题
开发语言·c++·算法
明月(Alioo)8 分钟前
OpenClaw与ClawHub的关系:当“智能体”遇上“技能商店”
python·ai·agent
喵手11 分钟前
Python爬虫实战:VS Code 扩展市场热门榜单“脱壳”实战!
vscode·爬虫·python·爬虫实战·零基础python爬虫教学·vscode扩展市场热门榜单·vs热门榜单数据采集