【Survival Analysis】【机器学习】【3】deepseek流程图

提交论文的时候,有的时候需要提供code 的流程图。

方法:

1 这边是直接把写好的代码放到大模型,,推荐使用deepseek.

2 然后大模型总结一下

3 根据总结出来的结果,使用proceeson, 或者ppt 美化一下

下图为deepseek的效果,其它几个都没办法用。

主要测试:豆包,文言一心,以及Kimi,以及Deepseek,通义千问

通义 - 你的实用AI助手

复制代码
┌───────────────────────────────────────────────────────────────────────────────┐
│                    Clinical Data Preprocessing Pipeline                       │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            1. Load Raw Data                                   │
│                                                                               │
│  - Read CSV file                                                            │
│  - Remove completely blank rows                                              │
│  - Print initial data dimensions                                             │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            2. Validate Data                                   │
│                                                                               │
│  - Check for empty DataFrame                                                 │
│  - Verify target column exists                                               │
│  - Validate target values (0/1)                                              │
│  - Check for missing clinical features                                       │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            3. Data Cleaning                                  │
│                                                                               │
│  - Select predefined clinical features                                       │
│  - Fill missing values:                                                     │
│    * Categorical: mode imputation                                           │
│    * Numerical: mean imputation                                             │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            4. Feature Engineering                            │
│                                                                               │
│  - One-Hot Encoding for multi-label features (lesion_location)               │
│  - Label Encoding for categorical variables (gender, pathological_type, etc.)│
│  - Print final feature count                                                 │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            5. Feature Correlation Analysis                   │
│                                                                               │
│  - Calculate correlation matrix                                              │
│  - Select features with correlation > threshold (0.15)                       │
│  - Visualize significant features' correlation                               │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            6. Save Processed Data                            │
│                                                                               │
│  - Create final dataset with significant features + target                    │
│  - Save to CSV file                                                          │
│  - Print final dataset dimensions                                            │
└───────────────────────────────────────────────────────────────────────────────┘
                                      │
                                      ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            Error Handling                                    │
│                                                                               │
│  - FileNotFoundError: Missing input file                                     │
│  - ValueError: Data validation failures                                      │
│  - General Exception: Other processing errors                                │
└───────────────────────────────────────────────────────────────────────────────┘
相关推荐
明朝百晓生4 小时前
强化学习【Monte Carlo Learning][MC Basic 算法]
人工智能·机器学习
云知谷9 小时前
【C++基本功】C++适合做什么,哪些领域适合哪些领域不适合?
c语言·开发语言·c++·人工智能·团队开发
rit84324999 小时前
基于MATLAB实现基于距离的离群点检测算法
人工智能·算法·matlab
初学小刘10 小时前
深度学习:从图片数据到模型训练(十分类)
人工智能·深度学习
递归不收敛10 小时前
大语言模型(LLM)入门笔记:嵌入向量与位置信息
人工智能·笔记·语言模型
之墨_11 小时前
【大语言模型】—— 自注意力机制及其变体(交叉注意力、因果注意力、多头注意力)的代码实现
人工智能·语言模型·自然语言处理
从孑开始12 小时前
ManySpeech.MoonshineAsr 使用指南
人工智能·ai·c#·.net·私有化部署·语音识别·onnx·asr·moonshine
涛涛讲AI12 小时前
一段音频多段字幕,让音频能够流畅自然对应字幕 AI生成视频,扣子生成剪映视频草稿
人工智能·音视频·语音识别
可触的未来,发芽的智生12 小时前
新奇特:黑猫警长的纳米世界,忆阻器与神经网络的智慧
javascript·人工智能·python·神经网络·架构
悟乙己12 小时前
MLops | 基于AWS Lambda 架构构建强大的机器学习(ML)血缘关系
机器学习·架构·aws