【机器学习】机器学习工程实战

文章目录

  • [第1章 概述](#第1章 概述)
    • [1.1 符号和定义](#1.1 符号和定义)
    • [1.2 什么是机器学习](#1.2 什么是机器学习)

书籍简介
【加】安德烈布可夫(Andriy Burkov ) 著
王海鹏 丁静 译
中国工信出版集团 人民邮电出版社


第1章 概述

1.1 符号和定义

1.1.1 数据结构

标量(scala)

一个简单的数值,如15或-3.25。

取标量值的变量或常量用斜体字母表示,如x或a。
向量(vector)

是一个有序的标量值列表,这些值称为属性。

向量可以用可视化的方式表示为箭头,指向某种方向,以及多维空间中的点。

二维向量举例:a = [2,3] , b = [-2,5] , c = [1,0]

我们想向量的一个属性表示为一个带索引的值,比如w(i)或x(j)

索引j表示一个向量的特定维度(dimension),即属性在列表中的位置。例如向量a中,a(1)=2,a(2)=3。

一个变量可以有两个或更多的索引,如 x i ( j ) x_{i}^{(j)} xi(j) 或 x i , j ( k ) x_{i,j}^{(k)} xi,j(k)。

例如在神经网络中,第l层中单元u的输入特征j表示为 x l , u ( j ) x_{l,u}^{(j)} xl,u(j)。
矩阵(matrix)

是一个以行和列排列的矩形数字阵列。

A= [ 2 − 2 1 3 5 0 ] \begin{bmatrix} 2 & -2 & 1\\ 3 & 5 & 0 \end{bmatrix} [23−2510] 是一个2行3列的矩阵
集合(set)

记为大写字母S

唯一元素的无序集。

一个集合可以是有限的(包括固定数量的值)。在这种情况下,用花括号来表示。

例如{1,3,18,23,235}或(x1,x2,x3,···,xn)。

另外,一个集合也可以是无限的,包括某个区间的所有值。
交集(intersection)

S1和S2的交集S3,我们写为 S 2 ← S 1 ∩ S 2 S_2 \leftarrow S_1 \cap S_2 S2←S1∩S2
|S|

表示集合S的大小,也就是它所包含的元素数量。

1.1.2大写西格玛记法

对集合X={x1,x2,···, x n − 1 x_{n-1} xn−1,x_n}或对向量的属性x=[x1,x2,···, x m − 1 x^{m-1} xm−1,xm]求和是这样表示的:

∑ i = 1 n x i = d e f \sum_{i=1}^{n} \ x_i \overset{def}{=} ∑i=1n xi=def x 1 + x 2 + ⋅ ⋅ ⋅ + x n − 1 + x n x_1 + x_2 +···+x_{n-1} + x_n x1+x2+⋅⋅⋅+xn−1+xn

∑ j = 1 m x ( j ) = d e f \sum_{j=1}^{m} \ x^{(j)} \overset{def}{=} ∑j=1m x(j)=def x ( 1 ) + x ( 2 ) + ⋅ ⋅ ⋅ + x ( m − 1 ) + x ( m ) x^{(1)} + x^{(2)} +···+x^{(m-1)} + x^{(m)} x(1)+x(2)+⋅⋅⋅+x(m−1)+x(m)

= d e f \overset{def}{=} =def 的意思是"定义为"。

向量x的欧氏范数(Euclidean norm),用 ∥ x ∥ \|x\| ∥x∥表示,表示向量的"大小"或"长度"。

通过计算 ∑ j = 1 D ( x ( j ) ) 2 \sqrt{\sum_{j=1}^{D}(x^{(j)})^2} ∑j=1D(x(j))2 得到。

两个向量a和b之间的距离由欧氏距离(Euclidean distance)给出:

∥ x ∥ = d e f ∑ i = 1 N ( a ( i ) − b i ) 2 \|x\| \overset{def}{=}\sqrt{\sum_{i=1}^{N}(a^{(i)}-b^{i})^2} ∥x∥=defi=1∑N(a(i)−bi)2

1.2 什么是机器学习

腊肉芥末果

打了一下午的字,学习进展缓慢,主要是数学符号太难输入了。。

后续待更新

基本是在抄书,后期是想梳理总结的。

相关推荐
爱喝白开水a9 分钟前
LangChain 基础系列之 Prompt 工程详解:从设计原理到实战模板_langchain prompt
开发语言·数据库·人工智能·python·langchain·prompt·知识图谱
takashi_void16 分钟前
如何在本地部署大语言模型(Windows,Mac,Linux)三系统教程
linux·人工智能·windows·macos·语言模型·nlp
OpenCSG21 分钟前
【活动预告】2025斗拱开发者大会,共探支付与AI未来
人工智能·ai·开源·大模型·支付安全
生命是有光的24 分钟前
【深度学习】神经网络基础
人工智能·深度学习·神经网络
数字供应链安全产品选型28 分钟前
国家级!悬镜安全入选两项“网络安全国家标准应用实践案例”
人工智能·安全·web安全
科技新知40 分钟前
大厂AI各走“开源”路
人工智能·开源
字节数据平台42 分钟前
火山引擎Data Agent再拓新场景,重磅推出用户研究Agent
大数据·人工智能·火山引擎
TGITCIC43 分钟前
LLaVA-OV:开源多模态的“可复现”革命,不只是又一个模型
人工智能·开源·多模态·ai大模型·开源大模型·视觉模型·大模型ai
GeeLark1 小时前
GeeLark 9月功能更新回顾
人工智能
mwq301231 小时前
GPT-2 中的 Pre-Layer Normalization (Pre-LN) 架构详解
人工智能