5.27周报

这两周邻近毕业故没有很多时间来学习课余内容,另外最近身体有些不舒服【偏头痛】,所以学的内容不多,包括SVM向量机和ResNet【不包括代码复现】

1.SVM支持向量机的大概内容

1、目的:

  1. 主要内容是如何找到分类的那条线【超平面】------>此线应该是唯一的,那么如何保证两条平行线的最大距离d。
    2.而我们的SVM的目的就是找到这个最大化d以及分类的超平面。

2、相关工作:

1.点到平面的距离 【因为要寻找到我们对样本进行分类的超平面】------>进而衍生到了向量X0到超平面的距离。
2. 将距离公式进行演变 ,目的是最大化d即为最小化||w||^2。

**3.给模型规定限制条件:**目的是区分支持向量和非支持向量。

3.引入松弛变量求W: 但是最小化方程1/2||W||^2最小化求极值点W是无解的,所以我们需要添加一个正则项(Regulation Term)去求解【也就是我们的松弛变量,在反向传播算法中常用来减少梯度消失问题】,还有一种可能优化问题求解的解并不是我们想要的,我们也需要加一个正则项。【本质凸优化问题求唯一极值点】

4.问题:但是如果样本为线性不可分,则无法进行分类:

1、引入思想: 高维映射,将低维矢量映射到高维,然后用一个向量代数式表示。【这里用了异或问题进行解释,参考链接】

在这里也有一个思想出现了:无限维度被线性可分的概率接近1。

2、后面得到了约束条件的方程【本质类似与低维,只是我们的W变成向量,而那个fai函数也是一个高维映射,两内积相乘为常量】,可以发现分类结果已经出来了。

5.所以按过程来说我们应该要求这个高维映射函数,这里涉及核函数的引入【具体推导过程参考链接】

目的:无需显式的计算高维映射函数,内积得到常量,减少复杂性【推导过程极其优美】

6.引入对偶问题和原问题,将优化问题转换到对偶空间【引入拉格朗日乘数,主要好处是优化问题变成了仅依赖于数据点之间内积的形式,在后续公式推导中可以直接将核函数进行带入计算出高维空间的内积(核技巧)】

笔记一:

关于对偶问题的学习以及原问题如何转换为对偶问题的学习

笔记二:

SVM解决线性可分问题

2.ResNet残差网络的学习

本文基于何明凯前辈论文的学习,首先是学习了残差网络的背景,就于梯度消失和cnn参数过大FLOPs过多,以及VGG/plain网络的劣势进行对比,进而提出方案【所涉及的技术,如何改进等】

笔记三:
https://blog.csdn.net/weixin_57128596/article/details/139223695

3.写了一个关于阿里艺术字的接口:

基于WordArt锦书模型,输入字体和提示词即可生成关于提示词的艺术字。

效果图:

后期展望:

1.CNN学习和+复习大模型

2.准备复现一下代码(结合几个大模型CNN,VGG,残差网络ResNet对于图片的分类)或者微调一下大模型(拿到了关于医学的数据)

想学习一下微调大模型。

数据如下:

相关推荐
JackHCC3 小时前
快手OneRetrieval:可编辑生成式电商召回
人工智能·机器学习
QiLinkOS3 小时前
第三视觉理解徐玉生与他的商业活动(30)
大数据·c++·人工智能·算法·开源协议
疯狂打码的少年4 小时前
【操作系统】页面置换算法(OPT/FIFO/LRU)
算法
小O的算法实验室4 小时前
2026年CIE,优化客货协同运输:综合地铁系统的列车容量动态分配
算法
Coder_Shenshen5 小时前
西门子S7CommPlus协议鉴权算法原理与流程详解
网络·后端·算法
硕风和炜5 小时前
【LeetCode: 2492. 两个城市间路径的最小分数 + DFS】
java·算法·leetcode·深度优先·dfs·bfs·并查集
星马梦缘6 小时前
机器学习与模式识别 第八章 MAP与偏方差 考点压缩
人工智能·机器学习·map·岭回归·mle·双重下降
我是一颗柠檬6 小时前
【Java项目技术亮点】加权轮询负载均衡算法
java·算法·负载均衡
一楼的猫6 小时前
AI写作合规技术方案:平台检测机制分析与规避策略
人工智能·学习·机器学习·ai写作
灯厂码农6 小时前
C语言动态内存分配完全指南(malloc、calloc、realloc、free)
java·c语言·算法