AI科研新范式不是让模型替你写论文,而是把论文变成一条可追踪、可审稿、可迭代的科研生产线------数据→写作依据文件→AI初稿→独立AI压测→逐轮提分→投稿包,全程文件可复查、责任在人。
【AI写论文的新范式&论文总体结构】:
科研新范式vs旧范式:旧范式:一个人写→同一个人改→AI只用来润色英文→审稿意见自己消化→上下文断了就重来,整个过程全手动执行。新范式:数据→写作依据文件→ AI生成可追踪初稿→独立AI担任审稿人→逐轮提分→投稿材料包,全程文件可复查、可审计、可复现------科研人员从"写论文的体力劳动者"升级为"科研工作流的设计者与最终责任人"。
从润色段落→审查数据链:旧范式让AI改英文,结果是漂亮文字掩盖结果不足;新范式先把数据、统计、图表、文献和核心claim整理成可追溯的写作依据文件,再生成论文------从根上避免 Discussion泛泛而谈、引用缺口、数字不齐、claim 越界。
双AI 分工≠一个写一个润色:Claude Code把分析结果写成可追踪初稿,Codex CLI在独立子进程里独立扮演审稿人------专查overclaim、统计缺口、图表不支撑结论、引用缺失。两者只通过draft.md/review_round_N.md文件交换信息,跨进程独立review打破单AI自查盲区,形成真实的"投稿前测试"。
论文总体结构参考高水平综合期刊(Science / Nature 等)常见叙事结构,具体格式按目标期刊调整:训练"问题→空白→方法→数据→边界"的科研叙事:Title→Abstract(broad significance第一句)→Intro(知识空白与本文贡献)→Results(每个数字配effect size+95%CI+n+检验+精确p)→ Discussion(机制、对比、局限性)→ Methods→Figures(每图服务一个核心claim)→ References(DOI人工核验,篇数按目标期刊调整)。
科研合规与人工责任边界+跨学科可迁移:AI不替代作者判断、不署名、不自动生成未经核验的引用;全程留下draft/review/revision/score_history/citations_todo/claim校准/prompt日志,构成可审计的科研写作档案。学科迁移按"数据形态"匹配------只要能整理出数据+分析脚本+统计结果 + 图表+核心结论,流程即可迁移。
两天完整产出

|---|---|
| 第一章:阶段⓪范式入门(M1)+阶段①数据生产(M2-M4)+阶段②初稿生成(M5-M6) 产出: 完整 Claude Code 项目环境 + analysis_results.json(写作依据文件)+ figures/ + draft.md v1 + ai_disclosure.md ||
模块一、阶段⓪范式入门科研新范式:传统写法vsAI时代科研写法
**【为什么把范式入门放在第一节】**不先讲清楚"传统论文写作"与"AI 时代科研写作"的根本差异,后面10个模块容易被误读成"10个AI工具使用技巧"------而它们本质上是同一条科研生产线的不同环节。
1、传统论文写作逻辑回顾------文字驱动/线性/留不下数据
起点:脑子里想→Word打开→一字一句堆出来
工具:Word + EndNote +自己脑子;AI最多润色英文
工作流:思考→大纲→写正文→自己看→同事帮看→投稿
痛点:上下文易丢、claim容易越界、引用容易编、Discussion容易泛泛、被审稿人退回时回滚困难
2、AI时代科研写作新范式------数据驱动/流水线/全程可审计
起点:先建写作依据文件(analysis_results.json + figures + claims.yaml)
工具:Claude Code写+ Codex CLI独立审稿;两个AI跨进程协作
工作流:数据先行→AI读数据生成初稿→独立AI压测→逐轮迭代→投稿封装
全过程留下:
draft/review_round_N/revision_round_N/ score_history/claim_calibration/citations_todo/prompt日志
3、三个本质区别(对照表精讲)
驱动方式:文字驱动→数据驱动(先有数字、再有句子)
质控方式:自查+同事抽空帮看→内部AI压力测试,按高水平综合期刊常见叙事标准做投稿前自查
可追溯:大脑+Word→文件系统全程可审计
4、角色升级------你不是"被AI替代",而是"升级为科研工作流的设计者与最终责任人"
**你定义:**研究问题/数据边界/方法学选型/目标期刊/claim强度
**AI干:**生成、挑错、对照、打分、打包
5、本节带来的认知锚点------后续每个模块都会回扣这个范式:M2是为这条流水线搭环境,M3是建写作依据文件,M5是把数据写成文字,M7-M9是独立测试,M10是按清单封装。
验收标准:学员能用自己的话回答两个问题------"为什么不能直接让 ChatGPT一次性帮我写完整篇论文?"以及"我这条论文生产线的每一步留下了什么文件?"。
**模块二、**阶段①数据生产Claude Code科研环境搭建
**【范式转移】**每次开新项目都要从头跟AI解释一遍课题背景→把课题背景沉淀进项目配置,AI在第一轮回复中就能用上你课题的术语、数据约束和目标期刊。
1、Claude Code + Codex CLI双工具安装与模型选型(Opus / Sonnet / Haiku 的成本与能力权衡)
产出:可用的双AI环境(claude --version + codex --version通过)
2、CLAUDE.md:把研究问题、数据来源、方法学约束、目标期刊写成 AI 永久可读的项目配置
3、Memory系统:跨对话保持研究上下文(research question/data/ findings)
产出:Memory配置
4、项目骨架:my-paper/{data, figures, runs, submission}
产出:完整科研项目骨架
验收标准:claude--version + codex --version输出有效版本号;CLAUDE.md含研究问题/数据/方法/期刊四项;my-paper/下data、figures、runs、submission四个目录全部存在;同样的提问,有CLAUDE.md与无 CLAUDE.md的两个回答质量肉眼可分。
**【范式转移】**下载/清洗/统计脚本写3天、bug反复改→自然语言描述假设,AI输出可运行脚本+字段齐全的统计结果JSON(每个数字都可追溯到来源脚本)。
模块三、阶段①数据生产数据获取与自动化分析
1、用Claude Code生成数据下载脚本(API/FTP/Web多种方式)
产出:下载脚本
2、数据清洗:缺失值、异常值、格式转换(CSV / Excel / JSON / Parquet / SQL)
产出:清洗脚本
3、自然语言→分析脚本:描述研究假设,Claude Code 协作设计分析方案(作者最终决定方法学选型)
产出:200+行Python脚本
4、统计严谨度全套:Bootstrap CI、Cohen's d效应量、多重比较校正、精确p值
产出:analysis_results.json(论文的"写作依据文件")
验收标准:analysis_results.json中每个主要结果必含estimate/ ci_low /ci_high/n/test/p_exact/script_path七个字段;脚本可在干净环境复跑、结果可复现。
**模块四、**阶段①数据生产科研绘图:图表作为数据结构
**【范式转移】**图表是写完文字后再补的"装饰"→图表先于文字成型,每张图作为一个claim的数据载体(图表即论证结构的一部分)。
1、符合主流期刊投稿格式的图表标准(字体/DPI/配色/error bars/ colorblind-safe)
产出:matplotlib模板
2、常见图表类型实操:scatter、heatmap、bar+CI、时间序列、forest plot
产出:3-4张图
3、多panel组合图:gridspec布局与统一配色
产出:组合figure(fig1_*.pdf + .png)
4、每张图 ↔一个claim的强绑定(参考顶刊论文图组组织方式)
产出:figures/投稿可用图表目录
验收标准:每张图配caption并标注对应的claim id;error bars/单位/ colorblind-safe三项自查通过;figure与analysis_results.json字段对应可追溯。
模块五、阶段②初稿生成论文初稿自动生成
1、论文结构按
Title→Abstract(broad significance)→Intro→Results→Discussion→Methods拆解
产出:论文大纲
2、Results:AI读JSON,自动嵌入effect size + 95% CI + n + 检验方法+精确p
产出:Results初稿
3、Discussion:机制解释+文献对比+局限性(不过度解释、不overclaim)
产出:Discussion初稿
4、Introduction:broad significance+知识空白+本文贡献
产出:draft.md完整初稿v1
关键技巧:让AI引用真实数字而非编造;用Memory防止长文写作中上下文丢失
验收标准:draft.md中每个核心数字都标注JSON来源字段(如[from: aod_trend.estimate]);Discussion每段对应一个claim id;无 [NUMBER_NEEDED] 占位符遗留;引用全部为 [CITATION_NEEDED: 主题] 占位(不允许AI编造DOI)。
模块****六、阶段②初稿生成AI合规:贯穿式质控钩子
1、主流期刊AI使用政策(Nature/Science/Elsevier/AC /AGU最新规定)+各期刊披露模板
2、贯穿式质控钩子:M1留CLAUDE.md/Memory配置;M2留 analysis_results.json + script_path;M4留prompt日志;M6/M7留review_round_N.md + revisions_log;M9留citations_todo.md + DOI核验状态
3、引用核验规则:AI生成的引用一律标记[CITATION_NEEDED],DOI / PMID /原文核验状态写入citations_todo.md,签字前100%人工核验
产出:ai_disclosure.md+数据上传红线清单+全程审计档案目录
验收标准:每条AI输出都能在runs/目录追溯到对应prompt +模型版本+时间戳;ai_disclosure.md含披露段+数据上传红线清单+引用核验状态字段。
|---|---|
| 第二章:阶段③压力测试(M7-M9)+阶段④投稿封装(M10-M11) 产出: 3轮审稿轨迹 + score_history.json + claim_calibration.md + manuscript.docx + cover_letter.md +学员自己课题的端到端样例 ||
模块****七、阶段③压力测试Codex首次独立审稿
**【范式转移】**写完只能等同事或导师挑刺,反馈慢、面子薄、不彻底→内部AI压力测试审稿人,按高水平综合期刊常见叙事标准做投稿前自查,不带情绪、不顾忌面子,按文件交付审稿报告。
1、Codex CLI配置+进程隔离验证(Codex在独立子进程运行,看不到 Claude 的system prompt,是真正独立的第二个AI)
产出:可用的Codex环境
2、把draft.md发给Codex:要求打分、列弱点、找overclaim
产出:review_round_1.md(典型4-5/10------低分是故意保留涨分空间)
3、解读首次审稿报告:overclaim/missing citation/statistical gaps/ 图表不支撑结论
产出:问题清单
关键时刻:"论文被打低分=看见涨分空间"------比让同事帮看更彻底、更可追溯
验收标准:review_round_1.md包含总分+问题分类(overclaim/stats/ citations/figures/structure)+具体修改建议;每条建议可对应 draft.md中的具体段落。
模块****八、阶段③压力测试双AI迭代改进
**【范式转移】**审稿意见看一遍就大改特改、越改越乱 → 一轮只修一类问题、每轮独立打分、分数曲线作为质量信号。
**1、Round 1:**措辞收敛(proves→is consistent with;rules out→argues against)
Codex重打分,预期变化+1~2分
**2、Round 2:**补引用+加统计检验+完善limitations
Codex再次审稿,预期变化+1分
**Round 3:**针对性修复剩余弱点→进入可继续打磨的内部初稿状态
3、核心能力:
**科研措辞分寸:**从"proves"到"is consistent with"(observation ≠ causation)
**引文补充:**用Claude Code的WebSearch查找缺失引用
每轮改进对照记录(revisions_log + score_history.json)
验收标准:score_history.json记录每轮总分与各维度分变化;revisions_log_round_N.md列出每轮修改前后对照;每轮针对一类问题修复且修改可对照(分数趋势作为参考,引入更严格标准时短暂回调正常)。
**模块九、**阶段③压力测试Claim校准------两个AI交叉质询
**【范式转移】**自己拍脑袋决定 claim强度,要么过强要么过弱→两个AI用同一把尺子独立打分,分歧暴露后由作者拍板。
1、/claim-check双盲打分流程:Claude和Codex看同一份claims.yaml,各打各的分
产出:双方评分对比表
2、分歧聚焦:哪些claim双方都打低分?哪些只有一方打低?为什么?
产出:claim_calibration.md
3、调整claim强度落地到正文:从过强/过弱拉回到数据支撑区间
产出:校准后的措辞清单(科研合规的最后一道把关)
验收标准:每个claim在claim_calibration.md中获得support_level: strong/moderate/weak/unsupported;分歧claim(两AI分差≥2)单独列出并附作者裁决理由。
**模块十、**阶段④投稿封装审图+投稿材料初版生成(人工核验后定稿)
【范式转移】投稿前1周突击拼凑cover letter、改图、补引用,焦头烂额→/finalize按核验清单组装投稿材料初版,作者按核验清单逐项定稿。
1、Codex审图:标签、单位、配色、可读性、colorblind-safe
产出:审图报告
2、修图:去夸张标题、加error bars、统一字体大小
产出:终版图表
3、Claude Code生成manuscript.docx初版(嵌入图表)------作者最终决定是否定稿
产出:submission/manuscript.docx
4、引用格式化(按目标期刊:Nature-style/APA/国标)+DOI/PMID人工核验清单
产出:submission/citations_todo.md(每条引用一行:DOI、核验人、核验状态)
5、Cover Letter初版生成+novelty陈述+推荐审稿人草拟------作者改写定稿
产出:submission/cover_letter.md
验收标准:manuscript.docx + cover_letter.md + citations_todo.md三件齐全;citations_todo.md中所有引用核验状态非空;AI披露段已写入正文;作者签字确认。
**模块十一、**阶段④投稿封装工作流迁移:把双AI流水线落到你自己的研究领域
**【范式转移】**学完只会复用讲师那个示例→现场把整条科研生产线按"数据形态"翻译成你自己学科的版本:同一条SOP,跑出N个不同学科的论文。这一节不是"加餐",而是验证你能否独立把课程方法迁移到下一个、下下一个课题。
**1、学科映射四件套:**把通用流水线翻译成"我的学科版"
**数据形态映射:**你的研究数据长什么样?时空遥感/临床随访/实验测量/调查问卷/模型输出/文本与日志/多模态影像
统计标准映射:你领域Reporting怎么写?effect size + 95% CI / OR +95% CI /β+ SE / Bayesian credible interval/Hazard Ratio
claim模式映射:你领域的claim粒度是什么?因果/相关/机理/关联/预测/探索性
**目标期刊映射:**你目标期刊偏好哪种结构?S/N broad significance/ IMRaD/CONSORT-style/工程基准+消融/注册报告
**2、迁移实操:**用自己学科的CLAUDE.md模板搭建my-paper/+跑通最小闭环
把学科特化的CLAUDE.md放进my-paper/,写入研究问题/数据约束/方法学习惯/目标期刊
跑通"一段数据→一张图→一个claim→Codex审一轮"最小闭环
产出:my-paper/自己领域版项目骨 + fig + claim + review_round_1.md
3、迁移难点集中答疑(20min)
**数据合规:**未发表/临床/涉密/企业合作数据怎么本地化跑
**统计习惯:**自己领域常用统计与课程示例的差异怎么改prompt
**期刊政策:**目标期刊的AI披露要求怎么写进ai_disclosure.md
产出:自己领域版CLAUDE.md模板+ my-paper/项目骨架+端到端样例+持续路径清单
验收标准:
大家的CLAUDE.md包含自己学科的报告标准/数据合规边界/目标期刊政策三项
端到端样例已跑通:data→figure→claim→review_round_1.md完整链路
结束前能给出"下周我把这条流水线推到[具体课题]的第一步动作"
能用自己的话回答:"这套流水线最难迁移的一环是哪一环?我打算怎么解决?"
**【准备】**准备一份小样本数据(CSV/Excel/JSON均可,建议 ≤ 100行示例);