提交论文的时候,有的时候需要提供code 的流程图。
方法:
1 这边是直接把写好的代码放到大模型,,推荐使用deepseek.
2 然后大模型总结一下
3 根据总结出来的结果,使用proceeson, 或者ppt 美化一下
下图为deepseek的效果,其它几个都没办法用。
主要测试:豆包,文言一心,以及Kimi,以及Deepseek,通义千问
┌───────────────────────────────────────────────────────────────────────────────┐
│ Clinical Data Preprocessing Pipeline │
└───────────────────────────────────────────────────────────────────────────────┘
│
▼
┌───────────────────────────────────────────────────────────────────────────────┐
│ 1. Load Raw Data │
│ │
│ - Read CSV file │
│ - Remove completely blank rows │
│ - Print initial data dimensions │
└───────────────────────────────────────────────────────────────────────────────┘
│
▼
┌───────────────────────────────────────────────────────────────────────────────┐
│ 2. Validate Data │
│ │
│ - Check for empty DataFrame │
│ - Verify target column exists │
│ - Validate target values (0/1) │
│ - Check for missing clinical features │
└───────────────────────────────────────────────────────────────────────────────┘
│
▼
┌───────────────────────────────────────────────────────────────────────────────┐
│ 3. Data Cleaning │
│ │
│ - Select predefined clinical features │
│ - Fill missing values: │
│ * Categorical: mode imputation │
│ * Numerical: mean imputation │
└───────────────────────────────────────────────────────────────────────────────┘
│
▼
┌───────────────────────────────────────────────────────────────────────────────┐
│ 4. Feature Engineering │
│ │
│ - One-Hot Encoding for multi-label features (lesion_location) │
│ - Label Encoding for categorical variables (gender, pathological_type, etc.)│
│ - Print final feature count │
└───────────────────────────────────────────────────────────────────────────────┘
│
▼
┌───────────────────────────────────────────────────────────────────────────────┐
│ 5. Feature Correlation Analysis │
│ │
│ - Calculate correlation matrix │
│ - Select features with correlation > threshold (0.15) │
│ - Visualize significant features' correlation │
└───────────────────────────────────────────────────────────────────────────────┘
│
▼
┌───────────────────────────────────────────────────────────────────────────────┐
│ 6. Save Processed Data │
│ │
│ - Create final dataset with significant features + target │
│ - Save to CSV file │
│ - Print final dataset dimensions │
└───────────────────────────────────────────────────────────────────────────────┘
│
▼
┌───────────────────────────────────────────────────────────────────────────────┐
│ Error Handling │
│ │
│ - FileNotFoundError: Missing input file │
│ - ValueError: Data validation failures │
│ - General Exception: Other processing errors │
└───────────────────────────────────────────────────────────────────────────────┘