git提取当前分支指定文件历史版本
场景:排查某个文件变化历史

import os
import subprocess
# ================= 配置 =================
# 注意:前面加 r 是为了防止报错,保持不动
TARGET_FILE = r"C://test//a.txt"
# 提取多少个版本
COUNT = 5
# 导出到哪个文件夹 (会自动创建在当前脚本目录下)
OUTPUT_DIR = "history_versions"
# =======================================
def run_cmd(cmd, cwd):
"""
cmd: git 命令
cwd: 执行命令的目录 (关键修复点)
"""
# 这里的 cwd 参数告诉 Python:去那个文件夹里运行 git
return subprocess.check_output(cmd, shell=True, cwd=cwd).decode('utf-8').strip()
def main():
if not os.path.exists(TARGET_FILE):
print(f"❌ 找不到文件: {TARGET_FILE} (请检查路径)")
return
# 1. 自动获取目标文件所在的目录
# Git 命令必须在这个目录下(或其父目录)运行,才能找到 .git 仓库
repo_work_dir = os.path.dirname(TARGET_FILE)
# 2. 准备输出目录
if not os.path.exists(OUTPUT_DIR):
os.makedirs(OUTPUT_DIR)
print(f"📂 切换工作目录至: {repo_work_dir}")
print(f"🔍 正在查找最近 {COUNT} 次修改记录...")
# 3. 获取日志
# 注意:cmd 里依然使用绝对路径的文件名,这样最稳妥
cmd_log = f'git log -n {COUNT} --pretty=format:"%h|%ad|%s" --date=format:"%Y%m%d_%H%M%S" -- "{TARGET_FILE}"'
try:
# 关键修改:把 repo_work_dir 传进去
logs = run_cmd(cmd_log, repo_work_dir).split('\n')
except subprocess.CalledProcessError as e:
print("\n❌ Git 执行失败!可能是因为该目录不是 Git 仓库,或者没有安装 Git。")
print(f"错误信息: {e}")
return
for i, log in enumerate(logs):
if not log: continue
try:
commit_hash, date, msg = log.split('|')
except ValueError:
continue # 跳过格式不对的行
# 4. 构造导出文件名
ext = os.path.splitext(TARGET_FILE)[1]
# 清洗文件名中的非法字符
safe_msg = "".join([c for c in msg if c.isalnum() or c in " -_"])[:30]
out_name = f"v{i + 1}_{date}_{commit_hash}_{safe_msg}{ext}"
out_path = os.path.join(OUTPUT_DIR, out_name)
# 5. 提取文件内容
# 使用 git show hash:绝对路径 (Windows下可能需要转义,这里最简单的办法是只给文件名,由 cwd 控制上下文)
# 但为了稳妥,我们使用 git show hash:./文件名 (相对路径) 或者处理一下路径
# 技巧:git show <hash>:<path> 需要 path 是相对于仓库根目录的路径。
# 直接用绝对路径在 git show <hash>:... 中经常会报错。
# 最稳妥的方法是:git show <hash> -- <绝对路径> 这样通常打印不出来内容到stdout
# 替代方案:既然我们已经在工作区了,用 git show <hash>:<文件名> (相对路径)
file_name_only = os.path.basename(TARGET_FILE)
# 尝试获取相对于 git 根目录的路径(这是最严谨的写法)
try:
git_root = run_cmd("git rev-parse --show-toplevel", repo_work_dir).replace('/', '\\')
rel_path = os.path.relpath(TARGET_FILE, git_root).replace('\\', '/')
except:
# 如果获取失败,尝试直接用文件名(仅当文件在根目录时有效,这步是保底)
rel_path = file_name_only
cmd_show = f'git show {commit_hash}:"{rel_path}"'
try:
content = run_cmd(cmd_show, repo_work_dir)
with open(out_path, 'w', encoding='utf-8') as f:
f.write(content)
print(f"✅ 已导出: {out_name}")
except Exception as e:
print(f"⚠️ 导出 {commit_hash} 失败。可能原因:路径转义问题或文件在该版本不存在。")
print(f" 尝试命令: {cmd_show}")
print("-" * 30)
print(f"🎉 完成!文件已保存在脚本所在目录的 '{OUTPUT_DIR}' 文件夹中。")
if __name__ == "__main__":
main()