机器学习《西瓜书》学习笔记《待续》

如果说,计算机科学是研究关于"算法"的学问,那么机器学习就是研究关于"学习算法"的学问。

目录

绪论

引言

为什么我们通过色泽青绿根蒂蜷缩敲声捉响就能判断是好瓜?

因为我们吃过、看过很多西瓜,所以基于色泽、根蒂、敲声 这几个特征我们就可以做出相当好的判断。类似的,我们从以往的学习经验知道,下足了功夫、弄清了概念、做好了作业,自然会取得好成绩。

可以看出,我们能做出有效的判断,是因为我们已经积累了许多经验,而通过对已有经验的利用,就能对新的情况做出有效的决策!!

上面对经验的利用是靠我们人类自身完成的,计算机能帮忙吗?

机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,"经验"通常以"数据"形式存在,因此,机器学习所研究的主要内容是关于在计算机上从数据中产生"模型(model)"的算法,即"学习算法"(learningalgorithm)。有了学习算法,我们把经验数据提供给它,它就能基于这些算法产生模型,在面对新的情况时,模型会给我们提供相应的判断。如果说,计算机科学是研究关于"算法"的学问,那么机器学习就是研究关于"学习算法"的学问。

基本术语

要进行机器学习,先要有数据,假定我们收集的的一批关于西瓜的数据,例如:

色泽 根蒂 敲声
青绿 蜷缩 浊响
乌黑 稍蜷 沉闷
浅白 硬挺 清脆
... ... ...

每行数据都是一条记录,这组记录的集合称为一个"数据集(dataset)",每条记录是关于一个事件或对象(这里是西瓜对象instance)的描述,成为一个"实例(instance)"或"样本(sample)"

反应事件或对象在某方面的表现或性质的项,如"色泽","根蒂","敲声",称为"属性(attribute)"或"特征(feature)"。属性的取值,如"青绿","乌黑",称为"属性值(attribute value)"

属性张成的空间称为"属性空间(attribute space)"、"样本空间(sample space)"或"输入空间(input space)"。

例如,把"色泽","根蒂","敲声"作为三个坐标轴,则它们的张成 一个用于描述西瓜的三维空间,每个西瓜都可以在这个空间中找到自己的坐标位置。由于空间中的每个点对应一个坐标向量,因此也把一个instance称为一个"特征向量(feature vector)"

一般地,令 D = {x1, x2, ... , xm} 表示包含 m 个示例的数据集,每个instance由 d 个属性描述(例如上面的西瓜数据使用了 3 个属性),则每个实例xi = (xi1; xi2; ... ; xid) 是 d 维样本空间 X 中的一个向量,xi∈X,其中 xij

xi在第j个属性上的取值(例如上述第 3 个西瓜在第 2 个属性上的值是"硬挺" ) , d 称为样本xi的"维数(dimensionality)

从数据中学得模型的过程称为"学习"(learning)或"训练"(training), 这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为"训练数据" (training data), 其中每个样本称为一个"训练样本" (training sample), 训练样本组成的集合称为"训练集"(training set).

扩展

向量的张成-span

使用Markdown语法编写数学公式

Markdown语法编写数学公式和LaTex有异曲同工之妙。(LaTex入门LaTex公式手册

在Markdown中编写数学公式通常使用LaTeX语法。对于渲染数学公式的Markdown编辑器(如GitHub、Jupyter Notebook、MathJax支持的环境等),可以使用以下两种方式编写数学公式:

在Markdown中编写数学公式通常使用LaTeX语法。对于渲染数学公式的Markdown编辑器(如GitHub、Jupyter Notebook、MathJax支持的环境等),可以使用以下两种方式编写数学公式:

行内公式使用单个美元符号 $ 包裹 LaTeX 公式,表示行内公式:

markdown 复制代码
这是行内公式,例如:$E = mc^2$

这是行内公式,例如: E = m c 2 E = mc^2 E=mc2

块级公式使用双美元符号 $$ 包裹 LaTeX 公式,表示块级公式(独立成行):

markdown 复制代码
这是块级公式:
$$
E = mc^2
$$

渲染后效果,这是块级公式:
E = m c 2 E = mc^2 E=mc2

复杂的数学公式

markdown 复制代码
贝叶斯定理:
$$
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
$$

渲染后效果:贝叶斯定理:
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac{P(B|A)P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)P(A)

常见数学符号:

  • 分数:\frac{a}{b}
  • 幂:a^b
  • 下标:a_b
  • 求和:\sum
  • 积分:\int

注意事项:

  • 并不是所有的Markdown编辑器都支持数学公式渲染,你可以检查是否支持MathJax或者KaTeX。
  • GitHub Markdown 不直接支持数学公式,需要额外的插件或工具。

希腊字母的LaTex语法

插入一些数学的结构

插入定界符

将上述定界符与\left和right组合使用可以使得定界符匹配其内容的高度,比如要构建一个如下的矩阵的行列式:

go 复制代码
$$
 \left|\begin{matrix}
    a & b & c \\
    d & e & f \\
    g & h & i
   \end{matrix} \right|
 $$

显示效果如下:

∣ a b c d e f g h i ∣ \left|\begin{matrix} a & b & c \\ d & e & f \\ g & h & i \end{matrix} \right| adgbehcfi

插入一些可变大小的符号

插入一些函数名称

插入二进制运算符和关系运算符

插入箭头符号

上下标

可以使用^来输出上标,使用_来输出下标,使用{}包含作用范围。

bash 复制代码
 $$
 \sin^2(\theta) + \cos^2(\theta) = 1
 $$
 
 $$
 \sum_{n=1}^\infty k
 $$
 
 $$
 \int_a^bf(x)\,dx
 $$
 
 $$
 \lim\limits_{x\to\infty}\exp(-x) = 0
 $$

sin ⁡ 2 ( θ ) + cos ⁡ 2 ( θ ) = 1 \sin^2(\theta) + \cos^2(\theta) = 1 sin2(θ)+cos2(θ)=1

∑ n = 1 ∞ k \sum_{n=1}^\infty k n=1∑∞k

∫ a b f ( x )   d x \int_a^bf(x)\,dx ∫abf(x)dx

lim ⁡ x → ∞ exp ⁡ ( − x ) = 0 \lim\limits_{x\to\infty}\exp(-x) = 0 x→∞limexp(−x)=0

输出矩阵

矩阵中的各元素通过用$来分隔,\来换行。

bash 复制代码
 $$
 \begin{matrix}
 0&1&2\\
 3&4&5\\
 6&7&8\\
 \end{matrix}
 $$

0 1 2 3 4 5 6 7 8 \begin{matrix} 0&1&2\\ 3&4&5\\ 6&7&8\\ \end{matrix} 036147258

输出分段函数

用\begin{cases}和\end{cases}来构造分段函数,中间则用\来分段:

go 复制代码
 $$
 f(x) = 
 \begin{cases}
 2x,\,\,x>0\\
 3x,\,\,x\le0\\
 \end{cases}
 $$

f ( x ) = { 2 x ,    x > 0 3 x ,    x ≤ 0 f(x) = \begin{cases} 2x,\,\,x>0\\ 3x,\,\,x\le0\\ \end{cases} f(x)={2x,x>03x,x≤0

字体

go 复制代码
$\mathbf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathbf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123

go 复制代码
 $\mathcal{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathcal{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123

go 复制代码
 $\mathfrak{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathfrak{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123

go 复制代码
$\mathsf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathsf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123

go 复制代码
 $\mathbb{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathbb{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123

相关推荐
dundunmm37 分钟前
机器学习之假设空间
人工智能·机器学习·数据挖掘
Sol-itude38 分钟前
【项目介绍】基于机器学习的低空小、微无人机识别技术
人工智能·算法·机器学习·matlab·无人机
B站计算机毕业设计超人39 分钟前
计算机毕业设计Django+Tensorflow音乐推荐系统 音乐可视化 卷积神经网络CNN LSTM音乐情感分析 机器学习 深度学习 Flask
大数据·人工智能·python·机器学习·课程设计·数据可视化·推荐算法
还没想好12343 分钟前
mlr3机器学习AUC的置信区间提取
人工智能·机器学习·r语言·学习笔记
IT古董1 小时前
【机器学习】机器学习的基本分类-强化学习-Deep Q-Network (DQN)
人工智能·机器学习·分类
chencjiajy1 小时前
机器学习基础:极大似然估计与交叉熵
深度学习·机器学习·损失函数
阿正的梦工坊1 小时前
矩阵变换:Scaling、Dilation、Rotation 和 Reflection对应的中文是什么?(中英双语)
人工智能·机器学习·矩阵
FakeOccupational1 小时前
【电路笔记 TMS320F28335DSP】DSP项目文件说明
笔记·dsp
0x2111 小时前
[论文阅读]Universal and transferable adversarial attacks on aligned language models
人工智能·机器学习·语言模型
知识分享小能手2 小时前
Java学习教程,从入门到精通,Java LinkedList(链表)语法知识点及案例代码(62)
java·大数据·开发语言·学习·链表·intellij-idea·大数据开发