DAY 31 文件的规范拆分和写法

今日的示例代码包含2个部分

  1. notebook文件夹内的ipynb文件,介绍下今天的思路
  2. 项目文件夹中其他部分:拆分后的信贷项目,学习下如何拆分的,未来你看到的很多大项目都是类似的拆分方法

知识点回顾

  1. 规范的文件命名
  2. 规范的文件夹管理
  3. 机器学习项目的拆分
  4. 编码格式和类型注解

**作业:**尝试针对之前的心脏病项目ipynb,将他按照今天的示例项目整理成规范的形式,思考下哪些部分可以未来复用。

大型项目拆分核心原则:模块化、低耦合、高内聚,信贷项目典型拆分方式:

复制代码
credit_project/
├── data/                 # 数据相关
│   ├── raw/              # 原始数据
│   ├── processed/        # 清洗后数据
│   └── data_loader.py    # 数据加载工具
├── model/                # 模型相关
│   ├── base_model.py     # 基础模型类
│   ├── classifier.py     # 分类模型实现
│   └── trainer.py        # 模型训练逻辑
├── utils/                # 通用工具
│   ├── metrics.py        # 评估指标
│   └── tools.py          # 辅助函数
├── config.py             # 配置参数
└── main.py               # 主程序入口
规范要点
  • 文件命名 :全小写 + 下划线(snake_case),如data_loader.py

  • 编码格式:UTF-8,避免中文乱码

  • 类型注解:明确函数参数和返回值类型,提升可读性

    from typing import List, Tuple, Optional

    def calculate_credit_score(features: List[float], weights: Optional[List[float]] = None) -> float:
    """计算信贷评分"""
    if not weights:
    weights = [0.5] * len(features)
    return sum(f * w for f, w in zip(features, weights))

    def split_data(data: List[Tuple[float, int]], test_size: float = 0.2) -> Tuple[List[Tuple[float, int]], List[Tuple[float, int]]]:
    """拆分训练集和测试集"""
    split_idx = int(len(data) * (1 - test_size))
    return data[:split_idx], data[split_idx:]

@浙大疏锦行

相关推荐
_深海凉_11 分钟前
LeetCode热题100-颜色分类
python·算法·leetcode
AC赳赳老秦33 分钟前
OpenClaw email技能:批量发送邮件、自动回复,高效处理工作邮件
运维·人工智能·python·django·自动化·deepseek·openclaw
zhaoshuzhaoshu42 分钟前
Python 语法之数据结构详细解析
python
AI问答工程师1 小时前
Meta Muse Spark 的"思维压缩"到底是什么?我用 Python 复现了核心思路(附代码)
人工智能·python
zfan5202 小时前
python对Excel数据处理(1)
python·excel·pandas
小饕2 小时前
我从零搭建 RAG 学到的 10 件事
python
老歌老听老掉牙2 小时前
PyQt5+Qt Designer实战:可视化设计智能参数配置界面,告别手动布局时代!
python·qt
格鸰爱童话3 小时前
向AI学习项目技能(六)
java·人工智能·spring boot·python·学习
悟空爬虫-彪哥3 小时前
VRChat开发环境配置,零基础教程
python
数据知道3 小时前
《 Claude Code源码分析与实践》专栏目录
python·ai·github·claude code·claw code