根据历年数据考研择校skill的设计和实现

GitHub - mcxiaoxiao/kaoyan-navigator-skill: 面向 Codex、Claude Code 与 AI Agent 的考研择校导航 Skill:联网调研复试线、统考名额、推免和拟录取数据,生成避坑提示与冲稳保建议。 · GitHub一个面向 Codex、Claude Code 和通用 AI Agent 的中国考研择校导航 Skill。输入目标学校、学院和专业后,Agent 会先从学校官网、研究生院、研招网和公开名单中寻找历年数据;只有关键数据确实找不到时,才向用户索取 CSV、Excel、JSON、PDF、截图或链接。

不做"算命式预测"。本项目输出的是可审计的风险信号、证据质量和置信度。

这个 Skill 是一个面向考研择校的工程交付。它先从学校研究生院、招生网、学院公告和拟录取公示里找历年数据; 只有关键字段确实找不到时,才请用户上传 CSV、PDF、截图或链接。输出里会保留来源、口径、缺失项、置信度与冲稳保建议。

它的重点不是简单堆数字,而是把"找数据"变成:

输入学校 / 学院 / 专业代码 / 入学年份 → 公开检索 → 证据分级 → 数据校验 → 冲稳保建议

3 步上手

  1. 先准备一个目标对象:学校、学院、专业代码、专业名称、培养方式、入学年份。
  2. 如果你已经有历年数据,先按 examples/sample.csv 的格式整理,再运行:
复制代码
python3 scripts/validate_data.py examples/sample.csv
  1. 如果你还没有数据,先让脚本生成检索计划:
复制代码
python3 scripts/research_plan.py \
  --school "XX大学" \
  --college "XX学院" \
  --major-code "085404" \
  --major-name "计算机技术" \
  --year 2027

数据怎么来

A. 你有 CSV / JSON

B. 你有 PDF / 截图 / 网页链接

  • 先抽取文本或表格。
  • 再把每一年的数据整理成一行。
  • 仍然缺失的字段,保留为空,不要猜。

C. 你什么都没有

  • 先按公开来源顺序全网找。
  • 优先学校研究生院、招生网、学院官网、官方 PDF 和公示。
  • 找不到关键字段时,再只问你最小必要的补充材料。

具体流程见 references/data-acquisition-flow.md

这个 Skill 会做什么

  • 规范化研究对象,避免学院、代码、培养方式混用。
  • 先找 Y-3Y-1 的历年数据,再判断趋势。
  • 记录来源等级、URL、发布日期和访问日期。
  • 给出证据质量、缺失项、风险和置信度。
  • 对"爆热 / 缩招 / 推免挤压 / 复试线虚低 / 改考"做分项审计。

仓库结构

复制代码
kaoyan-navigator-skill/
├── SKILL.md
├── agents/openai.yaml
├── examples/sample.csv
├── promotion/assets/
├── references/
│   ├── data-acquisition-flow.md
│   ├── data-schema.md
│   ├── decision-model.md
│   ├── report-template.md
│   └── research-playbook.md
└── scripts/
    ├── research_plan.py
    └── validate_data.py

让 Codex 直接识别这个 Skill

把整个仓库复制到本机技能目录:

复制代码
cp -R /path/to/kaoyan-navigator-skill ~/.codex/skills/kaoyan-navigator

或者在对话里直接使用:

复制代码
使用 $kaoyan-navigator,分析 2027 年入学的 XX 大学 XX 学院 085404 计算机技术。
先找 2024-2026 年的官方数据;如果拟录取名单找不到,就告诉我需要补什么。
相关推荐
罗西的思考27 分钟前
机器人 / 强化学习】HIL-SERL:人类在环驱动的具身智能进化框架
人工智能·算法·机器学习
IT_陈寒2 小时前
SpringBoot自动配置的坑,我的API突然就404了
前端·人工智能·后端
笃行3502 小时前
从零到上线:用 EdgeOne Makers + CodeBuddy 搭一个「对账核对员」AI Agent
人工智能
用户6856326208692 小时前
Claude Code 乱猜字段名?我给它写了一个"数据库查询约束 Skill"
人工智能
你_好2 小时前
# 给你的产品嵌入一个「会操作界面的 AI 助手」
人工智能
ShallWeL2 小时前
【机器学习】(3)—— 线性回归:梯度下降
人工智能·机器学习
陈广亮2 小时前
Prompt、Context、Harness、Agentic:LLM 应用四层嵌套结构,搞清自己卡在哪一层
人工智能
刺猬的温驯3 小时前
Flow Matching 训练的输入分布问题:从 VAE Latent 统计性质到归一化工程实践——以 VoxFlash-TTS 为例
人工智能·语音合成·tts
机器之心3 小时前
近80年后,埃尔德什经典「拉姆齐数下界」,被三位中国学者首次指数级改进
人工智能·openai
机器之心3 小时前
Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?
人工智能·openai