2024 6.24~6.30 周报

一、上周工作

机器学习,同时思考实验如何修改

二、本周计划

整理代码、设计损失函数并实验、安装LaTeX、

三、完成情况

3.1 整理代码

之前在工作站上跑的 在aba基础上改的

本周重新整理并编写了代码

3.2 机器学习

3.2.1 梯度下降的实现

需要找到合适的w,b对logistics回归模型参数的拟合,仍使用梯度下降来实现

和线性回归一样,可以对logistics的梯度下降进行学习率的检测、向量化的实现以及进行特征缩放等等。

3.2.2 过拟合

过拟合overfitting)简单来说是训练集上表现的很好,测试集上较差。

解决过拟合的方法:

  1. 第一个方法是去收集更多的数据
  2. 第二个方法是选择合适的特征,而不是选择过多的特征。特别是当数据量不够时,该方法可能会丢失一些有用信息
  3. 最后一种方法是正则化,可以减小一些参数的大小,这些参数对应的特征一般对整体影响较大。例如下面的右图,x的幂越高,就让其对应的参数变小。

3.2.3 正则化

正则化:让参数有更小的值,使其不容易发生过拟合。

但大多数我们不知道应该减小哪些特征对应的参数,这时候就可以对所有的参数进行处理。

一般只需要正则化参数进行处理,而无需对b。

对于正则化参数的选择,一个极端是设置其值为0,但失去了意义,另一个极端是选择其极大值,此时,由于需要保证成本函数取最低值,就需要保证的所有值都非常接近0。

如下图,如果取0,就会过拟合,但若取很大,会使最后的曲线接近f(x)=b。

正则化线性回归:

正则化logistics回归:

3.3 安装LaTex

texlive、texstudio的下载与安装

3.4 设计损失函数

等工作站空了跑实验 验证所设计的联合损失函数

调整权重

两个损失函数的结合

四、存在的主要问题

1.整理代码时遇到IndexError: index 10 is out of bounds for axis 0 with size 10

------通常是由于尝试访问一个空数组或矩阵的超出范围索引导致的。debug:检查数组的形状和大小,确保非空。数据加载处的代码有误,已修改。

2.整理代码时总是在dataset文件下面再次生成train_result、test_result两个文件夹

------因为根目录的原因。在PathConfig出修改成绝对路径。

五、下一步计划

跑实验

准备开始论文编写,再次学习师兄师姐的论文框架

相关推荐
zh路西法11 分钟前
【宇树机器人强化学习】(四):Go2基础训练以及参数调节与解析
python·深度学习·ubuntu·机器学习·机器人
q_354888515318 分钟前
计算机毕业设计源码:锦江酒店大数据分析与个性化推荐系统 Django框架 Vue 可视化 Hadoop 爬虫 协同过滤推荐算法 民宿 客栈(建议收藏)✅
python·机器学习·信息可视化·数据分析·django·课程设计·旅游
集芯微电科技有限公司27 分钟前
适用于GaN PD快充65W/33W超高频驱动器
人工智能·单片机·嵌入式硬件·深度学习·神经网络·机器学习·生成对抗网络
集芯微电科技有限公司36 分钟前
PC5204集成700V/7.5A 400mΩ增强型氮化镓GaN HEMT驱动器具有高功率密度运行
数据结构·人工智能·单片机·嵌入式硬件·神经网络·机器学习·生成对抗网络
好家伙VCC1 小时前
**NumPy中的高效数值计算:从基础到进阶的实战指南**在现代数据科学与机器学习领域
java·python·机器学习·numpy
荷蒲1 小时前
【小白量化机器人】爬取财经新闻并利用本地大模型评分选择合适交易策略
人工智能·python·机器学习·ai·金融·本地大模型
放下华子我只抽RuiKe51 小时前
智聊机器人进阶:从 API 调试到全功能交互界面的完美落地
开发语言·人工智能·python·机器学习·分类·机器人·交互
放下华子我只抽RuiKe51 小时前
构建企业级私有化 AI:从大模型原理到本地智聊机器人全栈部署指南
开发语言·人工智能·python·深度学习·机器学习·分类·机器人
FluxMelodySun2 小时前
机器学习(二十二) 原型聚类:k均值算法、学习向量量化、高斯混合聚类
人工智能·机器学习·聚类