【Survival Analysis】【机器学习】【3】deepseek流程图

提交论文的时候,有的时候需要提供code 的流程图。

方法:

1 这边是直接把写好的代码放到大模型,,推荐使用deepseek.

2 然后大模型总结一下

3 根据总结出来的结果,使用proceeson, 或者ppt 美化一下

下图为deepseek的效果,其它几个都没办法用。

主要测试:豆包,文言一心,以及Kimi,以及Deepseek,通义千问

通义 - 你的实用AI助手

复制代码
┌───────────────────────────────────────────────────────────────────────────────┐
│                    Clinical Data Preprocessing Pipeline                       │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            1. Load Raw Data                                   │
│                                                                               │
│  - Read CSV file                                                            │
│  - Remove completely blank rows                                              │
│  - Print initial data dimensions                                             │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            2. Validate Data                                   │
│                                                                               │
│  - Check for empty DataFrame                                                 │
│  - Verify target column exists                                               │
│  - Validate target values (0/1)                                              │
│  - Check for missing clinical features                                       │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            3. Data Cleaning                                  │
│                                                                               │
│  - Select predefined clinical features                                       │
│  - Fill missing values:                                                     │
│    * Categorical: mode imputation                                           │
│    * Numerical: mean imputation                                             │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            4. Feature Engineering                            │
│                                                                               │
│  - One-Hot Encoding for multi-label features (lesion_location)               │
│  - Label Encoding for categorical variables (gender, pathological_type, etc.)│
│  - Print final feature count                                                 │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            5. Feature Correlation Analysis                   │
│                                                                               │
│  - Calculate correlation matrix                                              │
│  - Select features with correlation > threshold (0.15)                       │
│  - Visualize significant features' correlation                               │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            6. Save Processed Data                            │
│                                                                               │
│  - Create final dataset with significant features + target                    │
│  - Save to CSV file                                                          │
│  - Print final dataset dimensions                                            │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            Error Handling                                    │
│                                                                               │
│  - FileNotFoundError: Missing input file                                     │
│  - ValueError: Data validation failures                                      │
│  - General Exception: Other processing errors                                │
└───────────────────────────────────────────────────────────────────────────────┘
相关推荐
刘一说几秒前
AI科技热点日报 | 2026年5月16日
人工智能·科技
逆境不可逃1 分钟前
Hello-Agents 第一部分总结:从智能体概念到大语言模型基础
人工智能·语言模型·自然语言处理
littlebigbar2 分钟前
亲身体验AI智能体在实际项目中展现的核心能力
人工智能·selenium·测试工具
Android出海3 分钟前
2026主流AI工具对比:ChatGPT、Gemini、Claude、Grok深度分析与选择
人工智能·ai·chatgpt·claude·grok·ai工具·gemini
霍格沃兹测试学院-小舟畅学3 分钟前
AI 测试用例审核 Skill:把用例评审从“凭经验”变成“可评分”
人工智能·测试用例
凌风工具箱4 分钟前
告别流量焦虑|凌风工具箱一键开启流量加速,适配 TEMU/Shein/TK 全平台
大数据·人工智能
langzaibeijing4 分钟前
性价比高的AI应用厂家
大数据·人工智能·python
NOCSAH5 分钟前
统好 AI|长期主义运营,保障智改数转可持续落地
人工智能
andafaAPS5 分钟前
安达发|粮食加工行业APS自动排程:开启智造升级的奇幻之旅
大数据·人工智能·安达发aps·车间排产软件·aps自动排程·计划排产软件
AI周红伟6 分钟前
DeepSeek V4模型本地部署指南:从环境配置到生产级优化
大数据·人工智能·搜索引擎·copilot·openclaw