机器学习,是让机器从海量数据中自主学习并拟合出人类难以直接推导的复杂规律或函数关系,进而实现对未知数据的预测与决策。
在机器学习中,"函式"通常指的是模型,即一个带有未知参数的数学函数,其目标是学习输入数据(如特征)与输出结果(如预测值)之间的映射关系。1
模型的核心是通过学习过程调整参数,以最小化预测值与真实值之间的差异。例如,在线性回归中,模型可能表示为 y = b + w*x,其中 x 是输入特征,y 是预测输出,而 w(权重)和 b(偏置)是需要通过训练数据学习的未知参数。1
机器学习有不同的类别
regression:假设要找的范式的输出是一个数值,这样的机器学习任务称为regression
例:预测未来某一个时间的PM2.5数值
要求机器寻找一个函式,输出是明天中午的PM2.5数值,输入是各种和预测PM2.5数值相关的指数(今天的PM2.5数值,今天的温度,今天的平均臭氧浓度),找这个函式的任务就是regression。
classification:人类事先准备一些选项,要求机器做选择题,输出是选项之一。
例1:输入一个电子邮件,要求判断该邮件是否为垃圾邮件,输出为是或否。
例2:设计阿尔法狗围棋程序,棋盘有19*19个位置,那就是一个有19*19个选项的选择题。
输入:棋盘上当前黑子和白子的位置。 输出:下一步应该下的最佳位置。
structured learning:机器不止要做选择题,不只是输出一个数字,而要产生一个有结构的物件。(让机器学会创造)
比如说,机器画一张图,写一篇文章。
