claude code workflow

'新建 Text Document.txt'根据我的资料，写一个工作大纲

Read 1 file (ctrl+o to expand)

● 根据您的资料，以下是整理后的正式工作大纲：

解耦型状态空间对比网络 (D-MAC) 工作大纲

项目核心目标：无需先验标签，实现跨区域零样本地壳介质特征提取与泛化。

第一阶段：数据矩阵构建

目标：利用极致时空多样性，阻断模型学习区域噪声捷径。

数据来源：本地 luzhou 文件夹，覆盖约一年连续波形
核心策略：构建跨季节、跨台站对的样本矩阵 B=P×TB = P \times TB=P×T
- PPP：不同台站对数量
- TTT：每对抽取的跨季节时间窗数量

第二阶段：频域对抗增强与张量预处理

目标：动态破坏振幅谱，强迫模型从相位/走时中提取介质特征。

输入张量维度：[Batch, 2, L]（双通道台站对 + 长序列）
频域扰动流程（PyTorch DataLoader 内实现）：
a. X_f = torch.fft.rfft(X, dim=-1) --- 进入频域
b. 提取 amp = |X_f|，phase = angle(X_f)
c. 生成平滑随机噪声包络 E(ω)E(\omega)E(ω)
d. 振幅抹除重构：X_f_aug = amp * E(ω) * exp(i·phase)
e. torch.fft.irfft 逆变换回时域

第三阶段：D-MAC 架构设计

目标：线性复杂度吞吐超长波形，并在表征空间强制分流。

┌────────────────────────┬───────────────────────────┬─────────────────────────────────┐

│ 模块 │ 实现 │ 作用 │

├────────────────────────┼───────────────────────────┼─────────────────────────────────┤

│ 降采样编码器 │ Conv1d(2, D, K, stride=S) │ 压缩超长序列，降低显存压力 │

│ 双向 Mamba 核心 │ 多层 mamba_ssm + 双向扫描 │ 线性复杂度获取双向时空感受野 │

│ 全局池化 │ Mean Pooling over time │ 提取隐状态 H∈RDH \in \mathbb{R}^DH∈RD │

│ 介质投影头 Head_Medium │ MLP + L2归一化 │ 输出介质特征向量 ZmZ_mZm │

│ 源投影头 Head_Source │ MLP + L2归一化 │ 输出源特征向量 ZsZ_sZs │

└────────────────────────┴───────────────────────────┴─────────────────────────────────┘

第四阶段：多目标对比损失函数

目标：在数学层面对介质特征与源特征进行正交切割。

Lmedium\mathcal{L}_{medium}Lmedium（InfoNCE）：
- 正样本：同一台站对，不同季节的 ZmZ_mZm（跨噪声认同一地球）
- 负样本：不同台站对的 ZmZ_mZm
Lsource\mathcal{L}_{source}Lsource（InfoNCE）：
- 正样本：同一时间窗，不同台站对的 ZsZ_sZs（提取共享背景噪声场）
- 负样本：同一台站对不同时间的 ZsZ_sZs
Lorth\mathcal{L}_{orth}Lorth（正交惩罚）：最小化批次内 ∣Zm⋅Zs∣|Z_m \cdot Z_s|∣Zm⋅Zs∣ 均值
联合优化目标：
Ltotal=λ1Lmedium+λ2Lsource+λ3Lorth\mathcal{L}{total} = \lambda_1 \mathcal{L}{medium} + \lambda_2 \mathcal{L}{source} + \lambda_3 \mathcal{L}{orth}Ltotal=λ1Lmedium+λ2Lsource+λ3Lorth
工程要求：强制开启 FP16 混合精度 + Gradient Checkpointing

第五阶段：零样本物理验证

目标：用严苛地震学指标证明 ZmZ_mZm 物理意义等价于格林函数。

Test A --- 季节不变性与解耦检验

输入：全新台站对一年期数据（365个时间窗）
指标：ZmZ_mZm 全年余弦相似度方差极小（>0.95），ZsZ_sZs 呈现与海洋风暴气候吻合的季节周期漂移

Test B --- 跨区域零样本频散回归

输入：USArray 训练模型，直接推断欧洲/日本未见区域
指标：冻结 D-MAC，外接轻量 MLP，少样本微调后精准拟合 Rayleigh 波群/相速度频散曲线

Test C --- 高分辨率空间介质聚类

输入：San Jacinto 断裂带节点台阵连续波形
指标：UMAP 降维 + K-Means 聚类边界，无需先验坐标即可映射出隐藏断层线/盆地边缘

建议启动顺序

1\] 数据加载器 + rfft 振幅抹除 Dataset 类 ↓ \[2\] 双向 Mamba Block 核心单元跑通测试 ↓ \[3\] 双投影头 + 正交损失函数实现 ↓ \[4\] 端到端训练（luzhou 数据）+ 显存优化 ↓ \[5\] Test A/B/C 物理验证评估 *** ** * ** *** 您想先从哪个模块开始写代码？数据加载器的 rfft 增强部分，还是双向 Mamba Block？ ✻ Cogitated for 36s \*\* ### ❯ 你分析一下优劣势和可行性 \*\* ● D-MAC 方案优劣势与可行性分析 *** ** * ** *** 优势 1. 理论设计严密 * 解耦双头 + 正交损失的组合在概念上非常干净，强迫 ZmZ_mZm 和 ZsZ_sZs 在信息论层面分离，避免了传统方法中介质/源信息混叠的根本缺陷。 * 频域振幅抹除的增强策略有坚实物理依据：背景噪声互相关的理论格林函数提取本就只依赖相位，振幅是干扰项。 2. 架构选型合理 * Mamba SSM 对超长时序的线性复杂度是真实优势，地震连续波形动辄数万点，Transformer 的 O(L2)O(L\^2)O(L2) 在此场景几乎不可用。 * 双向扫描保留因果与非因果信息，对走时提取有利。 3. 验证体系完整 * Test A/B/C 三级验证逻辑递进，且都与地震学物理量直接挂钩，不是黑盒指标，具备说服力。 *** ** * ** *** 劣势 / 风险点 1. 正交损失的训练稳定性存疑（最大风险） * Lmedium\\mathcal{L}{medium}Lmedium 和 Lsource\\mathcal{L}{source}Lsource 的正样本定义在逻辑上是"反向"拉扯的------两个 InfoNCE 在争抢同一个 HHH 里的信息。 * Lorth\\mathcal{L}_{orth}Lorth 很可能导致两个头都坍缩到零向量（表示崩溃），需要非常仔细的 λ\\lambdaλ 调参和梯度监控。 * 参考风险： VICReg、Barlow Twins 等正交解耦方法在简单视觉任务上已经很难调，地震数据信噪比更低，难度倍增。 2. Mamba 的工程门槛高 * mamba_ssm 依赖 CUDA 特定版本，在非 A100/H100 上编译经常失败。 * 双向 Mamba 没有官方实现，需要自己拼接前向/后向两路，显存是单向的 \~1.8x。 * 与 FP16 + Gradient Checkpointing 同时使用时，数值稳定性问题较多。 3. 数据量可能不足 * luzhou 单一区域约一年数据，构建的台站对数量 PPP 上限有限。 * 对比学习对 batch size 极度敏感（通常需要 ≥\\geq≥ 256 有效负样本），单区域数据很可能撑不起足够大的对比批次。 4. Test B 的"零样本"前提存在逻辑漏洞 * 用 luzhou（中国西南）训练，直接泛化到 USArray / 欧洲，地壳结构差异极大，没有任何 domain alignment 机制，零样本泛化期望过高。 * 文档里写的"USArray 训练"与第一阶段"用 luzhou 数据"互相矛盾，需要明确训练集。 5. 物理验证指标难以量化 * Test C 的聚类边界"完美映射断层线"在实际操作中无客观评分标准，容易变成主观可视化展示。 *** ** * ** *** 可行性综合评估 ┌──────────────┬───────┬────────────────────────────────────────┐ │ 维度 │ 评级 │ 说明 │ ├──────────────┼───────┼────────────────────────────────────────┤ │ 理论创新性 │ ★★★★★ │ 在地震学领域属于前沿，发顶刊有竞争力 │ ├──────────────┼───────┼────────────────────────────────────────┤ │ 工程实现难度 │ ★★★☆☆ │ Mamba 工程坑多，需要较强 CUDA 调试能力 │ ├──────────────┼───────┼────────────────────────────────────────┤ │ 训练成功概率 │ ★★★☆☆ │ 正交损失稳定性是最大不确定性 │ ├──────────────┼───────┼────────────────────────────────────────┤ │ 验证可信度 │ ★★★★☆ │ Test A/B 指标客观，Test C 需加强量化 │ ├──────────────┼───────┼────────────────────────────────────────┤ │ 数据充分性 │ ★★☆☆☆ │ 单区域数据对对比学习是短板 │ └──────────────┴───────┴────────────────────────────────────────┘ *** ** * ** *** 关键建议 必须优先解决的问题： 1. 先跑一个简化版消融实验------去掉 Mamba，用普通 CNN+GRU 验证双头正交损失能否正常收敛，再替换骨干网络。不要一上来就全部堆叠。 2. 明确数据规模------统计 luzhou 数据实际能构建多少台站对，估算最大 batch size，如果 P\<50P \< 50P\<50，对比损失基本无效，需要提前引入额外数据集（如 IRIS 公开数据）。 3. Test B 降低预期------把"零样本"改成"少样本微调"（few-shot fine-tuning），更真实也更容易在论文中自圆其说。 4. Lorth\\mathcal{L}_{orth}Lorth 改用更稳定的实现------考虑用 Barlow Twins 的冗余减少损失替代原始点积正交惩罚，数值更稳定。 *** ** * ** *** 总结： 这是一个理论上很有价值、但工程风险集中在训练稳定性和数据规模两个环节的方案。建议采用"由简入繁"策略，先验证核心解耦机制是否 work，再堆 Mamba 和完整验证体系。 ✻ Churned for 37s \*\* ### ❯ 你先写出全部相关的code 和test code，之后我会在我的server上run，先告诉我你准备怎么做step by step \*\* ● 实施计划 (Step by Step) *** ** * ** *** 整体文件结构 dmac/ ├── data/ │ ├── dataset.py # Dataset + rfft 振幅抹除增强 │ └── sampler.py # P×T 批次采样器 ├── models/ │ ├── stem.py # 1D-CNN 降采样编码器 │ ├── mamba_block.py # 双向 Mamba Block（手动拼接） │ ├── encoder.py # 完整 Bi-Mamba Encoder │ └── dmac.py # D-MAC 主模型（含双投影头） ├── losses/ │ └── contrastive.py # InfoNCE + 正交损失 + 联合损失 ├── train.py # 训练主循环（FP16 + GradCheckpoint） ├── evaluate.py # Test A/B/C 评估入口 ├── configs/ │ └── default.yaml # 超参数配置 └── tests/ ├── test_dataset.py ├── test_model.py ├── test_losses.py └── test_evaluate.py *** ** * ** *** Step 1 --- data/dataset.py + data/sampler.py * 扫描 luzhou 目录，解析台站对波形文件（假设 SAC/miniSEED 格式） * 实现 rfft 振幅抹除增强（DataLoader 内 on-the-fly） * PairBatchSampler：保证每个 batch 严格为 P×TP \\times TP×T 结构 Step 2 --- models/stem.py * Conv1d(2, D, kernel_size=K, stride=S) + BatchNorm + GELU * 输出压缩后的序列 \[Batch, D, L'

Step 3 --- models/mamba_block.py + models/encoder.py

封装 mamba_ssm.Mamba 为单层 Block（含残差 + LayerNorm）
双向：前向序列和 torch.flip 后向序列各过一路 Mamba，拼接后线性投影
堆叠 N 层 + Mean Pooling → H∈RDH \in \mathbb{R}^DH∈RD

Step 4 --- models/dmac.py

组合 Stem + Encoder + 两个 MLP 投影头
投影头输出强制 L2 归一化

Step 5 --- losses/contrastive.py

InfoNCELoss：通用实现，接受正样本 mask
medium_loss：按台站对分组构建正/负样本 mask
source_loss：按时间窗分组构建正/负样本 mask
orthogonality_loss：批次内 ∣Zm⋅ZsT∣|Z_m \cdot Z_s^T|∣Zm⋅ZsT∣ 均值
DMACLoss：三者加权合并，λ 可配置

Step 6 --- train.py

torch.cuda.amp.GradScaler + autocast（FP16）
torch.utils.checkpoint 包裹 Encoder（显存优化）
TensorBoard 日志：三个 loss 分项 + ZmZ_mZm/ZsZ_sZs 余弦相似度监控
定期 checkpoint 保存

Step 7 --- evaluate.py（Test A / B / C）

Test A：载入新台站对一年数据 → 提取 365 个 ZmZ_mZm/ZsZ_sZs → 计算全年余弦相似度方差
Test B：冻结 D-MAC → 提取目标区域 ZmZ_mZm → 外接轻量 MLP → 拟合频散曲线 → 输出 MAE
Test C：提取所有节点 ZmZ_mZm → UMAP 降维 → K-Means 聚类 → 可视化空间分布图

Step 8 --- tests/

每个模块独立 unit test，用随机张量验证 shape、梯度流通、loss 数值合理性
不依赖真实数据，CI 可直接跑通

几个需要你确认的前提

在我开始写之前，需要你明确几点：

波形文件格式： luzhou 数据是 SAC、miniSEED、还是 numpy/h5 格式？
序列长度 LLL：每个时间窗多长？（例如 30 分钟 @ 1Hz = 1800 点）
Mamba 是否已安装： server 上是否已有 mamba_ssm 包，CUDA 版本是多少？
GPU 显存：多少 GB？决定 batch size 和是否必须开 Gradient Checkpointing。
台站对数量 PPP：大概有多少对台站？

确认后我直接开始逐文件写完整代码。