【Survival Analysis】【机器学习】【3】deepseek流程图

提交论文的时候,有的时候需要提供code 的流程图。

方法:

1 这边是直接把写好的代码放到大模型,,推荐使用deepseek.

2 然后大模型总结一下

3 根据总结出来的结果,使用proceeson, 或者ppt 美化一下

下图为deepseek的效果,其它几个都没办法用。

主要测试:豆包,文言一心,以及Kimi,以及Deepseek,通义千问

通义 - 你的实用AI助手

复制代码
┌───────────────────────────────────────────────────────────────────────────────┐
│                    Clinical Data Preprocessing Pipeline                       │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            1. Load Raw Data                                   │
│                                                                               │
│  - Read CSV file                                                            │
│  - Remove completely blank rows                                              │
│  - Print initial data dimensions                                             │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            2. Validate Data                                   │
│                                                                               │
│  - Check for empty DataFrame                                                 │
│  - Verify target column exists                                               │
│  - Validate target values (0/1)                                              │
│  - Check for missing clinical features                                       │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            3. Data Cleaning                                  │
│                                                                               │
│  - Select predefined clinical features                                       │
│  - Fill missing values:                                                     │
│    * Categorical: mode imputation                                           │
│    * Numerical: mean imputation                                             │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            4. Feature Engineering                            │
│                                                                               │
│  - One-Hot Encoding for multi-label features (lesion_location)               │
│  - Label Encoding for categorical variables (gender, pathological_type, etc.)│
│  - Print final feature count                                                 │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            5. Feature Correlation Analysis                   │
│                                                                               │
│  - Calculate correlation matrix                                              │
│  - Select features with correlation > threshold (0.15)                       │
│  - Visualize significant features' correlation                               │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            6. Save Processed Data                            │
│                                                                               │
│  - Create final dataset with significant features + target                    │
│  - Save to CSV file                                                          │
│  - Print final dataset dimensions                                            │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            Error Handling                                    │
│                                                                               │
│  - FileNotFoundError: Missing input file                                     │
│  - ValueError: Data validation failures                                      │
│  - General Exception: Other processing errors                                │
└───────────────────────────────────────────────────────────────────────────────┘
相关推荐
WitsMakeMen3 分钟前
训练时开启 KV 缓存会和is_causal=False 冲突
人工智能·缓存·语言模型·自然语言处理·llm·transformer
WitsMakeMen4 分钟前
qwen3 训练loss 出现nan
人工智能·语言模型·自然语言处理·llm·qwen3
sukalot4 分钟前
BoostKit TensorFlow 性能优化源码深度解析
人工智能·性能优化·tensorflow
yuanmenghao5 分钟前
自动驾驶中间件iceoryx - 快速上手
人工智能·机器学习·自动驾驶
郝学胜-神的一滴7 分钟前
李航《机器学习方法》全面解析与高效学习指南
人工智能·python·算法·机器学习·数学建模·scikit-learn
丝斯20118 分钟前
AI学习笔记整理(40)——自然语言处理算法之Seq2Seq
人工智能·笔记·学习
Fuly10248 分钟前
大模型蒸馏技术简介
人工智能·深度学习·机器学习
skywalk81639 分钟前
分子动力学轨迹分析工具:高效、灵活的 TorchMD 分子动力学轨迹分析与可视化工具集
人工智能
熊猫钓鱼>_>9 分钟前
Tbox使用教程与心得体验:智能体驱动我的“2025年大模型发展工作总结及企业智能办公场景应用前景“深度报告生成
大数据·人工智能·ai·llm·提示词·智能体·tbox
还是大剑师兰特13 分钟前
拥抱AI,还是大剑师兰特2025年博客创作详细总结
人工智能·大剑师·2025博客之星