什么是机器学习

WongKyunban2024-12-29 22:50

机器学习，英文Machine learning，是人工智能（AI，artificial intelligence）的一个分支。旨在使机器或计算机像人一样学习，通过让其接触更多的数据，以期其能够自动执行任务，提高其性能和准确性。

机器学习算法的学习系统一般分为三个部分：

决策过程：一般，机器学习算法都是用来做预测或分类。基于一些输入数据，这些数据可能被标记或没被标记，做出关于数据模式的推测
误差函数：误差函数是用来评估预测模型的。比如说，如果有一些已知的例子，那么误差函数就可以与这些已知例子做比较，以此来评估预测模型的准确性。
模型优化过程：如果模型可以更好拟合训练集中的数据点，那么就可以调整权重，减少已知例子与模型预测之间的差距。机器算法会重复这个过程------评估和优化，自动更新权重，直到达到某个准确性的阈值。

误差函数是必须的，如果模型没有被评估过，那么我们就不知道这个模型到底可不可靠或者说可靠到什么程度。典型的做法就是拿已知的和预测值做比较。

模型优化过程也是必须的，在这个模型能够拿来用之前，必须完成这个过程，这个过程利用训练数据集中的数据点，通过不断读取数据点，评估预测值与实际值的差距，不断调整权重，将函数的输入和输出值，尽可能符合训练集中的映射关系，这就是所谓的拟合。要一个模型百分百预测正确，其实是很困难的，随着训练数据集越大，拟合过程就越久，因为要不断的评估与优化，每一次权重的调整都可能会影响前面的数据点。这个过程在预测的准确率达到某个预期值就可以结束了。否则就很难结束了。

决策过程就是在模型"成品"时拿来用时的事情了。