【Survival Analysis】【机器学习】【3】deepseek流程图

提交论文的时候,有的时候需要提供code 的流程图。

方法:

1 这边是直接把写好的代码放到大模型,,推荐使用deepseek.

2 然后大模型总结一下

3 根据总结出来的结果,使用proceeson, 或者ppt 美化一下

下图为deepseek的效果,其它几个都没办法用。

主要测试:豆包,文言一心,以及Kimi,以及Deepseek,通义千问

通义 - 你的实用AI助手

复制代码
┌───────────────────────────────────────────────────────────────────────────────┐
│                    Clinical Data Preprocessing Pipeline                       │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            1. Load Raw Data                                   │
│                                                                               │
│  - Read CSV file                                                            │
│  - Remove completely blank rows                                              │
│  - Print initial data dimensions                                             │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            2. Validate Data                                   │
│                                                                               │
│  - Check for empty DataFrame                                                 │
│  - Verify target column exists                                               │
│  - Validate target values (0/1)                                              │
│  - Check for missing clinical features                                       │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            3. Data Cleaning                                  │
│                                                                               │
│  - Select predefined clinical features                                       │
│  - Fill missing values:                                                     │
│    * Categorical: mode imputation                                           │
│    * Numerical: mean imputation                                             │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            4. Feature Engineering                            │
│                                                                               │
│  - One-Hot Encoding for multi-label features (lesion_location)               │
│  - Label Encoding for categorical variables (gender, pathological_type, etc.)│
│  - Print final feature count                                                 │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            5. Feature Correlation Analysis                   │
│                                                                               │
│  - Calculate correlation matrix                                              │
│  - Select features with correlation > threshold (0.15)                       │
│  - Visualize significant features' correlation                               │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            6. Save Processed Data                            │
│                                                                               │
│  - Create final dataset with significant features + target                    │
│  - Save to CSV file                                                          │
│  - Print final dataset dimensions                                            │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            Error Handling                                    │
│                                                                               │
│  - FileNotFoundError: Missing input file                                     │
│  - ValueError: Data validation failures                                      │
│  - General Exception: Other processing errors                                │
└───────────────────────────────────────────────────────────────────────────────┘
相关推荐
草堂春睡足几秒前
【Datawhale AI夏令营】科大讯飞AI大赛(大模型技术)/夏令营:让AI理解列车排期表
人工智能·笔记
余俊晖1 分钟前
GRPO强化学习缓解多模态大模型OCR任务的幻觉思路及数据生成思路
人工智能
sssammmm7 分钟前
AI入门学习-模型评估示例讲解
人工智能·学习
小Tomkk9 分钟前
AutoLabelImg:高效的数据自动化标注工具和下载
运维·人工智能·自动化
aneasystone本尊11 分钟前
构建和使用 RAGFlow 的标签集
人工智能
柠檬味拥抱17 分钟前
CI/CD与模型监控平台集成MLOps系统实现的全面路径
人工智能
人生都在赌19 分钟前
MCP生态全景:2025年最值得关注的AI工具集成现状深度调研
人工智能·ai编程·mcp
旧时光巷35 分钟前
【机器学习-2】 | 决策树算法基础/信息熵
算法·决策树·机器学习·id3算法·信息熵·c4.5算法
落了一地秋1 小时前
4.5 优化器中常见的梯度下降算法
人工智能·算法·机器学习
格林威1 小时前
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现卫星图像识别(C#代码,UI界面版)
人工智能·深度学习·数码相机·yolo·计算机视觉