参数的读取

argparse函数的读取

这个是以函数的形式嵌入到脚本中的

python 复制代码
def common_args():
    parser = argparse.ArgumentParser(description='common config')
    parser.add_argument('--test', action='store_true', help="test mode (load model and test dataset)")
    parser.add_argument('--iters', type=int, default=200000, help="training iters")
    parser.add_argument('--lr', type=float, default=1e-2, help="initial learning rate")
    parser.add_argument('--lr_net', type=float, default=1e-3, help="initial learning rate")
    parser.add_argument('--ckpt', type=str, default='latest')
    args = parser.parse_args()
    return args

py文件的读取

python 复制代码
import os
from pathlib import Path
from easydict import EasyDict as edict

FILE_PATH = Path(__file__).resolve()
ROOT_DIR = FILE_PATH.parents[1]

proj_conf = edict()

# 基本路径的设置
proj_conf.path = edict()
proj_conf.path.root_dir = str(ROOT_DIR)

# 其他参数的设置,比如网络模型dim
proj_conf.model = edict()
proj_conf.model.hidden_dim = 512

yaml文件的读取

python 复制代码
# coding:utf-8
import yaml
import os

# 获取当前脚本所在文件夹路径
curPath = os.path.dirname(os.path.realpath(__file__))
# 获取yaml文件路径
yamlPath = os.path.join(curPath, "cfgyaml.yaml")

# open方法打开直接读出来
f = open(yamlPath, 'r', encoding='utf-8')
cfg = f.read()
print(type(cfg))  # 读出来是字符串
print(cfg)

d = yaml.load(cfg)  # 用load方法转字典
print(d)
print(type(d))
# dict

@dataclass装饰器读取

python 复制代码
import json
import numpy as np
from dataclasses import dataclass
from typing import Optional, Tuple

@dataclass
class ModelArgs:
    channel: int = 128
    input_shape: tuple = (32, 32)
    schedule: str = "linear"
    num_timesteps: int = 1000
    schedule_low: float = 1e-4
    schedule_high: float = 0.02
    norm_eps: float = 1e-5
    cuda: bool = True
    max_batch_size: int = 32
    max_seq_len: int = 2048

    ffn_dim_multiplier: Optional[float] = None  # python 3.10 可以这么写: ffn_dim_multiplier: int | None = None

# 用法如下: 创建的时候传入就可以了,然后在主函数里面进行定义
class Diffusion:
    def __init__(self, args: ModelArgs):
        super(Diffusion, self).__init__()
        self.model_args = args
        
if __name__ == "__main__":
    with open("params.json", "r") as f:
        params = json.loads(f.read())

    max_seq_len = 2048
    max_batch_size = 16
    model_args: ModelArgs = ModelArgs(
        max_seq_len=max_seq_len,
        max_batch_size=max_batch_size,
        **params,
    )
相关推荐
多米Domi0115 小时前
0x3f第33天复习 (16;45-18:00)
数据结构·python·算法·leetcode·链表
freepopo5 小时前
天津商业空间设计:材质肌理里的温度与质感[特殊字符]
python·材质
森叶5 小时前
Java 比 Python 高性能的原因:重点在高并发方面
java·开发语言·python
小二·6 小时前
Python Web 开发进阶实战:混沌工程初探 —— 主动注入故障,构建高韧性系统
开发语言·前端·python
Lkygo6 小时前
LlamaIndex使用指南
linux·开发语言·python·llama
小二·6 小时前
Python Web 开发进阶实战:低代码平台集成 —— 可视化表单构建器 + 工作流引擎实战
前端·python·低代码
Wise玩转AI6 小时前
团队管理:AI编码工具盛行下,如何防范设计能力退化与知识浅薄化?
python·ai编程·ai智能体·开发范式
赵谨言7 小时前
Python串口的三相交流电机控制系统研究
大数据·开发语言·经验分享·python
鹿角片ljp7 小时前
Engram 论文精读:用条件记忆模块重塑稀疏大模型
python·自然语言处理·nlp
Blossom.1187 小时前
AI Agent的长期记忆革命:基于向量遗忘曲线的动态压缩系统
运维·人工智能·python·深度学习·自动化·prompt·知识图谱