机器学习(1)-----基础概念

目录

1.什么是人工智能

2.人工智能三大概念

3.什么是机器学习

4.什么是深度学习

5.学习方式

6.机器学习常用术语

7.数据集的划分

8.机器学习算法分类

8.1有监督学习

8.2无监督学习

8.3半监督学习

8.3强化学习


1.什么是人工智能

人工智能(Artificial Intelligence,AI)指通过计算机系统模拟人类智能的技术与科学,涵盖学习、推理、感知、决策等能力。其核心目标是让机器执行通常需要人类智能的任务,如语言理解、图像识别、问题解决等。

简单来说就是----仿智;像人一样机器智能的综合与分析;机器模拟代替人类

2.人工智能三大概念

三者关系

机器学习是实现人工智能的一种方式,基于统计学

深度学习是机器学习的一种方法发展而来的,基于神经网络

3.什么是机器学习

让机器自动学习,而不是基于规则的编程(不依赖于特定规则编程)

4.什么是深度学习

深度学习也叫深度神经网络,大脑仿生,设计一层一层的神经元模仿万事万物

5.学习方式

1.基于规则的学习,专家系统,用手工的if-else方式进行的预测

2.基于模型的学习,从数据中自动学出规律

6.机器学习常用术语

1.样本:一行数据就是一个样本,多个样本组成数据集;有时一条样本被叫做一条记录

2.特征:一列数据一个特征,有时也被称为属性,特征是从数据中抽取出来的,对结果预测有用的信息

3.标签/目标:模型要预测的那一列数据

x_train训练集中的数据(特征) y_train训练集中的标签(目标值)

x_test测试集中的数据(特征) y_test测试集中的标签(目标值)

7.数据集的划分

1.训练集:用来训练模型的数据集

2.测试集:用来测试模型的数据集

一般训练集/测试集==8/2或7/3

8.机器学习算法分类

8.1有监督学习

定义 :输入数据是由输入特征值和目标值所组成,即输入的训练数据有标签的

数据集:需要标注数据的标签/目标

有监督学习分为分类问题和回归问题

分类问题:

目标值(标签值)是不连续的,具体的类别(优秀,良好,差)

分类种类:二分类,多分类

回归问题:

目标值(标签值)是连续的(数字)

8.2无监督学习

定义:输入数据没有被标记,即样本数据类型未知,没有标签,根据样本间的相似性,对样本集聚类,以发现事物内部结构及相互关系

数据集:不需要标注数据

特点:1.训练数据无标签

2.根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系

8.3半监督学习

拿有标记的数据训练模型,然后拿训练好的模型对未标记的数据进行预测,然后人为的去校准

8.3强化学习

基本原理:通过构建四个要素:Agent,环境状态,行动,奖励,Agent根据环境状态进行行动获得更多的累积奖励

小孩子学走路的过程

(1)小孩子就是Agent,他试图通过采取行动(即行走),来操纵环境(行走的地面)

(2)并且从一个状态转化到另一个状态(他走的每一步)

(3)当他完成任务的子任务时,孩子得到奖励(吃糖)

(4)并且他不能走路时,就不会得到巧克力

相关推荐
xiao5kou4chang6kai42 小时前
蒸散发与光合作用阻抗理论 → ArcGIS自动化 → 区域ET/GPP产品融合
人工智能·蒸散发·植被生产力估算·penman-monteith
cd_949217212 小时前
骁龙与F1的故事:一场连接与速度的深度对话
人工智能
新加坡内哥谈技术2 小时前
大语言模型的上下文工程指南
人工智能
Gofarlic_OMS2 小时前
装备制造企业Fluent许可证成本分点典型案例
java·大数据·开发语言·人工智能·自动化·制造
2501_948114242 小时前
DeepSeek V4 全面实测:万亿参数开源模型的工程落地与成本推演
人工智能·ai·开源
程序员雷欧2 小时前
大模型应用开发学习第八天
大数据·人工智能·学习
liukuang1102 小时前
伊利、蒙牛、飞鹤与光明乳业:存量时代的攻守之道与价值分化
大数据·人工智能·物联网
前进的李工2 小时前
LangChain使用AI工具赋能:解锁大语言模型无限潜力
开发语言·人工智能·语言模型·langchain·大模型
北京耐用通信2 小时前
无缝衔接·高效传输——耐达讯自动化CC-Link IE转Modbus TCP核心解决方案
网络·人工智能·物联网·网络协议·自动化·信息与通信