什么是机器学习

机器学习,英文Machine learning,是人工智能(AI,artificial intelligence)的一个分支。旨在使机器或计算机像人一样学习,通过让其接触更多的数据,以期其能够自动执行任务,提高其性能和准确性。

机器学习算法的学习系统一般分为三个部分:

  1. 决策过程:一般,机器学习算法都是用来做预测或分类。基于一些输入数据,这些数据可能被标记或没被标记,做出关于数据模式的推测
  2. 误差函数:误差函数是用来评估预测模型的。比如说,如果有一些已知的例子,那么误差函数就可以与这些已知例子做比较,以此来评估预测模型的准确性。
  3. 模型优化过程:如果模型可以更好拟合训练集中的数据点,那么就可以调整权重,减少已知例子与模型预测之间的差距。机器算法会重复这个过程------评估和优化,自动更新权重,直到达到某个准确性的阈值。

误差函数是必须的,如果模型没有被评估过,那么我们就不知道这个模型到底可不可靠或者说可靠到什么程度。典型的做法就是拿已知的和预测值做比较。

模型优化过程也是必须的,在这个模型能够拿来用之前,必须完成这个过程,这个过程利用训练数据集中的数据点,通过不断读取数据点,评估预测值与实际值的差距,不断调整权重,将函数的输入和输出值,尽可能符合训练集中的映射关系,这就是所谓的拟合。要一个模型百分百预测正确,其实是很困难的,随着训练数据集越大,拟合过程就越久,因为要不断的评估与优化,每一次权重的调整都可能会影响前面的数据点。这个过程在预测的准确率达到某个预期值就可以结束了。否则就很难结束了。

决策过程就是在模型"成品"时拿来用时的事情了。

相关推荐
小天才才9 分钟前
前沿论文汇总(机器学习/深度学习/大模型/搜广推/自然语言处理)
人工智能·深度学习·机器学习·自然语言处理
MPCTHU16 分钟前
机器学习的数学基础:神经网络
机器学习
新加坡内哥谈技术39 分钟前
Meta计划借助AI实现广告创作全自动化
运维·人工智能·自动化
西猫雷婶1 小时前
pytorch基本运算-导数和f-string
人工智能·pytorch·python
Johny_Zhao1 小时前
华为MAAS、阿里云PAI、亚马逊AWS SageMaker、微软Azure ML各大模型深度分析对比
linux·人工智能·ai·信息安全·云计算·系统运维
顽强卖力1 小时前
第二十八课:深度学习及pytorch简介
人工智能·pytorch·深度学习
述雾学java1 小时前
深入理解 transforms.Normalize():PyTorch 图像预处理中的关键一步
人工智能·pytorch·python
武子康1 小时前
大数据-276 Spark MLib - 基础介绍 机器学习算法 Bagging和Boosting区别 GBDT梯度提升树
大数据·人工智能·算法·机器学习·语言模型·spark-ml·boosting
要努力啊啊啊1 小时前
使用 Python + SQLAlchemy 创建知识库数据库(SQLite)—— 构建本地知识库系统的基础《一》
数据库·人工智能·python·深度学习·自然语言处理·sqlite
武子康1 小时前
大数据-277 Spark MLib - 基础介绍 机器学习算法 Gradient Boosting GBDT算法原理 高效实现
大数据·人工智能·算法·机器学习·ai·spark-ml·boosting