python处理【orc】下载压缩的.zip文件,windows和linux同时适配

一. 前言

在Python中处理ZIP文件时,要实现Windows和Linux的跨平台适配问题。

二. 代码

python 复制代码
import os
import zipfile
from pathlib import Path
import re


def extract_preserve_structure(zip_path: str, extract_to: str):
    """
    解压 ZIP,自动剥离绝对路径前缀,保留任务目录下的完整子结构。
    假设有效内容位于某个纯数字目录(如 123/)之下。
    """
    with zipfile.ZipFile(zip_path, 'r') as zip_ref:

        for file_info in zip_ref.infolist():
            # 安全地处理路径,去除绝对路径和危险字符
            original_name = file_info.filename
            safe_name = os.path.normpath(original_name).lstrip('/\\')
            safe_name = safe_name.lstrip('.' + os.sep)

            # 跳过以斜杠开头的绝对路径
            if safe_name.startswith('/') or ':' in safe_name:
                safe_name = os.path.basename(safe_name)

            target_path = Path(extract_to) / safe_name
            
            # 如果是目录,创建目录
            if original_name.endswith('/'):
                target_path.mkdir(parents=True, exist_ok=True)
            else:
                # 确保父目录存在
                target_path.parent.mkdir(parents=True, exist_ok=True)

                # 解压文件
                with zip_ref.open(file_info) as src:
                    with open(target_path, 'wb') as dst:
                        dst.write(src.read())
                        
            print(f"已解压: {original_name} -> {target_path}")


zip_path = '20251114_175148_d33b98204c084b81bf56e8277097a0f5 - 副本.zip'
extract_to = '.'
extract_preserve_structure(zip_path, extract_to)
         

三. 总结

  • 路径分隔符:始终使用/作为ZIP内部路径分隔符
  • 文件权限:在非Windows系统上正确处理UNIX文件权限
  • 编码问题:处理文件名编码,支持中文等特殊字符
  • 路径安全:防止ZIP路径遍历攻击
  • 符号链接:根据需要处理符号链接(默认不跟随)
相关推荐
2301_8194143013 分钟前
使用Python进行图像识别:CNN卷积神经网络实战
jvm·数据库·python
WZTTMoon15 分钟前
从互斥锁到无锁,Java 20年并发安全进化史
java·python·安全
2501_9181269125 分钟前
学习所有6502写游戏控制器的语句
java·linux·网络·汇编·嵌入式硬件
JuckenBoy27 分钟前
Linux环境安装SGLang框架运行自选大模型(以Rocky9.7为例)
linux·运维·大模型·qwen·rocky·deepseek·sglang
十巷无终35 分钟前
Kali Virtual Machines(虚拟机镜像)安装后问题及解决办法
linux·运维·服务器
赵民勇38 分钟前
gtkmm库之GtkWindow与ApplicationWindow用法详解
linux·c++
Sakuraba Ema39 分钟前
从零理解 MoE(Mixture of Experts)混合专家:原理、数学、稀疏性、专家数量影响与手写 PyTorch 实现
人工智能·pytorch·python·深度学习·数学·llm·latex
嫂子的姐夫1 小时前
041-全扣补环境:同花顺
爬虫·python·js逆向·逆向
柯儿的天空1 小时前
【OpenClaw 全面解析:从零到精通】第 006 篇:OpenClaw 在 Windows/WSL2 上的安装与部署实战
人工智能·windows·语言模型·chatgpt·ai作画
BestOrNothing_20151 小时前
(4)Ubuntu 22.04 安装后使用 GParted 重新分区实战记录
linux·gparted·ubuntu22.04·ubuntu磁盘分区