机器学习《西瓜书》学习笔记《待续》

如果说,计算机科学是研究关于"算法"的学问,那么机器学习就是研究关于"学习算法"的学问。

目录

绪论

引言

为什么我们通过色泽青绿根蒂蜷缩敲声捉响就能判断是好瓜?

因为我们吃过、看过很多西瓜,所以基于色泽、根蒂、敲声 这几个特征我们就可以做出相当好的判断。类似的,我们从以往的学习经验知道,下足了功夫、弄清了概念、做好了作业,自然会取得好成绩。

可以看出,我们能做出有效的判断,是因为我们已经积累了许多经验,而通过对已有经验的利用,就能对新的情况做出有效的决策!!

上面对经验的利用是靠我们人类自身完成的,计算机能帮忙吗?

机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,"经验"通常以"数据"形式存在,因此,机器学习所研究的主要内容是关于在计算机上从数据中产生"模型(model)"的算法,即"学习算法"(learningalgorithm)。有了学习算法,我们把经验数据提供给它,它就能基于这些算法产生模型,在面对新的情况时,模型会给我们提供相应的判断。如果说,计算机科学是研究关于"算法"的学问,那么机器学习就是研究关于"学习算法"的学问。

基本术语

要进行机器学习,先要有数据,假定我们收集的的一批关于西瓜的数据,例如:

色泽 根蒂 敲声
青绿 蜷缩 浊响
乌黑 稍蜷 沉闷
浅白 硬挺 清脆
... ... ...

每行数据都是一条记录,这组记录的集合称为一个"数据集(dataset)",每条记录是关于一个事件或对象(这里是西瓜对象instance)的描述,成为一个"实例(instance)"或"样本(sample)"

反应事件或对象在某方面的表现或性质的项,如"色泽","根蒂","敲声",称为"属性(attribute)"或"特征(feature)"。属性的取值,如"青绿","乌黑",称为"属性值(attribute value)"

属性张成的空间称为"属性空间(attribute space)"、"样本空间(sample space)"或"输入空间(input space)"。

例如,把"色泽","根蒂","敲声"作为三个坐标轴,则它们的张成 一个用于描述西瓜的三维空间,每个西瓜都可以在这个空间中找到自己的坐标位置。由于空间中的每个点对应一个坐标向量,因此也把一个instance称为一个"特征向量(feature vector)"

一般地,令 D = {x1, x2, ... , xm} 表示包含 m 个示例的数据集,每个instance由 d 个属性描述(例如上面的西瓜数据使用了 3 个属性),则每个实例xi = (xi1; xi2; ... ; xid) 是 d 维样本空间 X 中的一个向量,xi∈X,其中 xij

xi在第j个属性上的取值(例如上述第 3 个西瓜在第 2 个属性上的值是"硬挺" ) , d 称为样本xi的"维数(dimensionality)

从数据中学得模型的过程称为"学习"(learning)或"训练"(training), 这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为"训练数据" (training data), 其中每个样本称为一个"训练样本" (training sample), 训练样本组成的集合称为"训练集"(training set).

扩展

向量的张成-span

使用Markdown语法编写数学公式

Markdown语法编写数学公式和LaTex有异曲同工之妙。(LaTex入门LaTex公式手册

在Markdown中编写数学公式通常使用LaTeX语法。对于渲染数学公式的Markdown编辑器(如GitHub、Jupyter Notebook、MathJax支持的环境等),可以使用以下两种方式编写数学公式:

在Markdown中编写数学公式通常使用LaTeX语法。对于渲染数学公式的Markdown编辑器(如GitHub、Jupyter Notebook、MathJax支持的环境等),可以使用以下两种方式编写数学公式:

行内公式使用单个美元符号 $ 包裹 LaTeX 公式,表示行内公式:

markdown 复制代码
这是行内公式,例如:$E = mc^2$

这是行内公式,例如: E = m c 2 E = mc^2 E=mc2

块级公式使用双美元符号 $$ 包裹 LaTeX 公式,表示块级公式(独立成行):

markdown 复制代码
这是块级公式:
$$
E = mc^2
$$

渲染后效果,这是块级公式:
E = m c 2 E = mc^2 E=mc2

复杂的数学公式

markdown 复制代码
贝叶斯定理:
$$
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
$$

渲染后效果:贝叶斯定理:
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac{P(B|A)P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)P(A)

常见数学符号:

  • 分数:\frac{a}{b}
  • 幂:a^b
  • 下标:a_b
  • 求和:\sum
  • 积分:\int

注意事项:

  • 并不是所有的Markdown编辑器都支持数学公式渲染,你可以检查是否支持MathJax或者KaTeX。
  • GitHub Markdown 不直接支持数学公式,需要额外的插件或工具。

希腊字母的LaTex语法

插入一些数学的结构

插入定界符

将上述定界符与\left和right组合使用可以使得定界符匹配其内容的高度,比如要构建一个如下的矩阵的行列式:

go 复制代码
$$
 \left|\begin{matrix}
    a & b & c \\
    d & e & f \\
    g & h & i
   \end{matrix} \right|
 $$

显示效果如下:

∣ a b c d e f g h i ∣ \left|\begin{matrix} a & b & c \\ d & e & f \\ g & h & i \end{matrix} \right| adgbehcfi

插入一些可变大小的符号

插入一些函数名称

插入二进制运算符和关系运算符

插入箭头符号

上下标

可以使用^来输出上标,使用_来输出下标,使用{}包含作用范围。

bash 复制代码
 $$
 \sin^2(\theta) + \cos^2(\theta) = 1
 $$
 
 $$
 \sum_{n=1}^\infty k
 $$
 
 $$
 \int_a^bf(x)\,dx
 $$
 
 $$
 \lim\limits_{x\to\infty}\exp(-x) = 0
 $$

sin ⁡ 2 ( θ ) + cos ⁡ 2 ( θ ) = 1 \sin^2(\theta) + \cos^2(\theta) = 1 sin2(θ)+cos2(θ)=1

∑ n = 1 ∞ k \sum_{n=1}^\infty k n=1∑∞k

∫ a b f ( x )   d x \int_a^bf(x)\,dx ∫abf(x)dx

lim ⁡ x → ∞ exp ⁡ ( − x ) = 0 \lim\limits_{x\to\infty}\exp(-x) = 0 x→∞limexp(−x)=0

输出矩阵

矩阵中的各元素通过用$来分隔,\来换行。

bash 复制代码
 $$
 \begin{matrix}
 0&1&2\\
 3&4&5\\
 6&7&8\\
 \end{matrix}
 $$

0 1 2 3 4 5 6 7 8 \begin{matrix} 0&1&2\\ 3&4&5\\ 6&7&8\\ \end{matrix} 036147258

输出分段函数

用\begin{cases}和\end{cases}来构造分段函数,中间则用\来分段:

go 复制代码
 $$
 f(x) = 
 \begin{cases}
 2x,\,\,x>0\\
 3x,\,\,x\le0\\
 \end{cases}
 $$

f ( x ) = { 2 x ,    x > 0 3 x ,    x ≤ 0 f(x) = \begin{cases} 2x,\,\,x>0\\ 3x,\,\,x\le0\\ \end{cases} f(x)={2x,x>03x,x≤0

字体

go 复制代码
$\mathbf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathbf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123

go 复制代码
 $\mathcal{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathcal{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123

go 复制代码
 $\mathfrak{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathfrak{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123

go 复制代码
$\mathsf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathsf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123

go 复制代码
 $\mathbb{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathbb{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123

相关推荐
时光追逐者22 分钟前
MongoDB从入门到实战之MongoDB快速入门(附带学习路线图)
数据库·学习·mongodb
一弓虽27 分钟前
SpringBoot 学习
java·spring boot·后端·学习
硅谷秋水1 小时前
GAIA-2:用于自动驾驶的可控多视图生成世界模型
人工智能·机器学习·自动驾驶
深度之眼1 小时前
2025时间序列都有哪些创新点可做——总结篇
人工智能·深度学习·机器学习·时间序列
晓数2 小时前
【硬核干货】JetBrains AI Assistant 干货笔记
人工智能·笔记·jetbrains·ai assistant
我的golang之路果然有问题2 小时前
速成GO访问sql,个人笔记
经验分享·笔记·后端·sql·golang·go·database
genggeng不会代码2 小时前
用于协同显著目标检测的小组协作学习 2021 GCoNet(总结)
学习
lwewan2 小时前
26考研——存储系统(3)
c语言·笔记·考研
搞机小能手2 小时前
六个能够白嫖学习资料的网站
笔记·学习·分类
nongcunqq3 小时前
爬虫练习 js 逆向
笔记·爬虫