【Survival Analysis】【机器学习】【3】deepseek流程图

提交论文的时候,有的时候需要提供code 的流程图。

方法:

1 这边是直接把写好的代码放到大模型,,推荐使用deepseek.

2 然后大模型总结一下

3 根据总结出来的结果,使用proceeson, 或者ppt 美化一下

下图为deepseek的效果,其它几个都没办法用。

主要测试:豆包,文言一心,以及Kimi,以及Deepseek,通义千问

通义 - 你的实用AI助手

复制代码
┌───────────────────────────────────────────────────────────────────────────────┐
│                    Clinical Data Preprocessing Pipeline                       │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            1. Load Raw Data                                   │
│                                                                               │
│  - Read CSV file                                                            │
│  - Remove completely blank rows                                              │
│  - Print initial data dimensions                                             │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            2. Validate Data                                   │
│                                                                               │
│  - Check for empty DataFrame                                                 │
│  - Verify target column exists                                               │
│  - Validate target values (0/1)                                              │
│  - Check for missing clinical features                                       │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            3. Data Cleaning                                  │
│                                                                               │
│  - Select predefined clinical features                                       │
│  - Fill missing values:                                                     │
│    * Categorical: mode imputation                                           │
│    * Numerical: mean imputation                                             │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            4. Feature Engineering                            │
│                                                                               │
│  - One-Hot Encoding for multi-label features (lesion_location)               │
│  - Label Encoding for categorical variables (gender, pathological_type, etc.)│
│  - Print final feature count                                                 │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            5. Feature Correlation Analysis                   │
│                                                                               │
│  - Calculate correlation matrix                                              │
│  - Select features with correlation > threshold (0.15)                       │
│  - Visualize significant features' correlation                               │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            6. Save Processed Data                            │
│                                                                               │
│  - Create final dataset with significant features + target                    │
│  - Save to CSV file                                                          │
│  - Print final dataset dimensions                                            │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            Error Handling                                    │
│                                                                               │
│  - FileNotFoundError: Missing input file                                     │
│  - ValueError: Data validation failures                                      │
│  - General Exception: Other processing errors                                │
└───────────────────────────────────────────────────────────────────────────────┘
相关推荐
AI科技星15 分钟前
全域数学信息原本72分册(数学物理卷)
人工智能·算法·数学建模·数据挖掘·量子计算
AI袋鼠帝6 小时前
4万Star开源神作曝光顶级AI们的System Prompt!太有意思了~4万Star开源神作曝光顶级AI们的System Prompt!太有意思了~
人工智能
❀͜͡傀儡师7 小时前
AI 中转站(Sub2API)搭建
人工智能·sub2api·ai 中转站
甲维斯7 小时前
Claude“山寨版”来了,支持中文,可配“任意模型”
人工智能·ai编程
测试员周周8 小时前
【AI测试智能体】为什么传统测试方法对智能体失效?
开发语言·人工智能·python·功能测试·测试工具·单元测试·测试用例
RSTJ_16258 小时前
PYTHON+AI LLM DAY THREETY-NINE
开发语言·人工智能·python
怕浪猫8 小时前
荒岛原始无工业、无电力、无设备,从零搭建最基础计算机体系
人工智能·设计模式·面试
2601_949499948 小时前
金价涨、光模块跌?不,它们之间存在更复杂的四重关联
人工智能·区块链
tanis_20778 小时前
Deepseek V4 Pro 新手极速上手指南
人工智能·语言模型
AI袋鼠帝8 小时前
阿里最强视频模型!千问App首发灰测 HappyHorse 1.0
人工智能