10.25 脚本 整理2024全年 GITHUB每周热门项目

需求 : 整理2024全年GITHUB热门项目

功能

  1. 一次性 bash 内嵌 Python3 脚本:

  2. 遍历 /.../github-weekly-rank-main/2024/01/ 下全部 *.md

3.把每个文件里的「排名表格」洗成"一 行一个项目"极简清单

4.调用 Moonshot API 生成「中文名+人话说明」

5.结果保存为 .txt (如 2024-01-A GITHUB热门项目#

脚本 (^..^)ノ (^..^)ノ (^._.^)ノ

复制整段(含开头 python3 -x)到终端回车即可跑,无需落盘任何文件

python3 -x <<'EOF'

---------- 唯一需要改的 ----------

API_KEY = "sk-哥们你自己的要是🔑🔑🔑"

ROOT_DIR = "/storage/emulated/0/Android/LLS_2025/Xmind/临时/github-weekly-rank-main/2024"

----------------------------------

import re, pathlib, requests, os, sys, string

ROOT_DIR = pathlib.Path(ROOT_DIR)

url = "https://api.moonshot.cn/v1/chat/completions"

hdr = {"Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json"}

def call_kimi(text: str) -> str:

prompt = f"""

下面是一段GitHub每周飙升榜Markdown表格,请清洗并按以下严格格式输出:

  1. 每项目压缩成两行:

第一行:序号. 中文一句话名(英文原名)

第二行: 项目地址 , 人话一句话说明(20~40字)

  1. 去掉图标、增长箭头、图片;序号保留;中文名优先。

  2. 不输出任何额外文字,不总结,不空行分段。

{text}

"""

payload = {

"model": "kimi-k2-turbo-preview",

"messages": [{"role": "user", "content": prompt.strip()}],

"temperature": 0.3,

"max_tokens": 4000

}

r = requests.post(url, headers=hdr, json=payload, timeout=120)

r.raise_for_status()

return r.json()["choices"][0]["message"]["content"].strip()

for month_dir in sorted(ROOT_DIR.iterdir()): # 2024/01 2024/02 ...

if not month_dir.is_dir():

continue

year_month = month_dir.name # "01" "02" ...

每月重新从 A 开始

for idx, md_file in enumerate(sorted(month_dir.glob("*.md"))):

letter = string.ascii_uppercase[idx % 26] # A B C ... 每轮循环

save_name = f"2024-{year_month}-{letter} github热门项目.txt"

txt_file = md_file.with_name(save_name) # 同目录换名

if txt_file.exists():

continue

content = md_file.read_text(encoding="utf-8")

table = "\n".join(re.findall(r"^\|.*\|$", content, flags=re.M))

if not table:

print(f"[SKIP] 无表格 {md_file}")

continue

print(f"[DO] {md_file} → {txt_file.name}")

try:

cleaned = call_kimi(table)

txt_file.write_text(cleaned, encoding="utf-8")

print(f"[OK] 已保存 {txt_file}")

except Exception as e:

print(f"[ERR] {md_file} : {e}")

print("全部完成!")

EOF

下面附赠一个文件整理并生成目录脚本

#!/bin/bash

一键合并 2024- 前缀文件,输出目录同 /2024/

复制保存为 merge2024.sh 后直接 bash merge2024.sh 即可

ROOT="/storage/emulated/0/Android/LLS_2025/Xmind/临时/github-weekly-rank-main/2024"

OUT_FILE="$ROOT/2024-github热门项目合集.txt"

cd "$ROOT" || exit

收集所有 2024-*.txt 并按自然顺序排列

mapfile -d '' LIST < <(find . -maxdepth 2 -type f -iname '2024-*.txt' -print0 | sort -zV)

IFS='\\n' LIST=((printf '%s\0' "${LIST[@]}" | tr '\0' '\n'))

{

echo "===== 大纲 ====="

for i in "${!LIST[@]}"; do

printf "%2d. %s\n" ((i+1)) "{LIST[i]#./}"

done

echo

echo "===== 正文 ====="

for f in "${LIST[@]}"; do

echo

echo "--- ${f#./} ⬇️⬇️⬇️⬇️⬇️ ---"

cat "$f"

done

} > "$OUT_FILE"

echo "报告已生成:(realpath "OUT_FILE")"

相关推荐
三万棵雪松几秒前
【Linux 物联网网关主控系统-Web部分(二)】
linux·前端·物联网
一叶之秋14121 分钟前
通信之道:解锁Linux进程间通信的无限可能(一)
linux·运维·服务器
Deitymoon2 分钟前
linux——线程的概念
linux
郝学胜-神的一滴4 分钟前
Pytorch自动微分模块:从原理到实战,解锁反向传播核心奥秘
服务器·人工智能·pytorch·python·深度学习·机器学习
eF06U766F6 分钟前
Ubuntu Linux 上 固定P/E 核混合架构CPU频率
linux·ubuntu·架构
minji...8 分钟前
Linux 多线程(三)线程控制,线程终止,线程中的异常问题
linux·运维·服务器·开发语言·网络·算法
zzzsde9 分钟前
【Linux】进程间通信(1)管道&&进程池实现
linux·运维·服务器
Miki Makimura11 分钟前
C++ 聊天室项目:Linux 环境搭建与问题总结
linux·开发语言·c++
CappuccinoRose12 分钟前
排序算法和查找算法 - 软考备战(十五)
数据结构·python·算法·排序算法·查找算法
lifallen19 分钟前
Flink Agents:从 DataStream 到 Agent 算子的接入与装配
java·大数据·人工智能·python·语言模型·flink