机器学习(1)-----基础概念

目录

1.什么是人工智能

2.人工智能三大概念

3.什么是机器学习

4.什么是深度学习

5.学习方式

6.机器学习常用术语

7.数据集的划分

8.机器学习算法分类

8.1有监督学习

8.2无监督学习

8.3半监督学习

8.3强化学习


1.什么是人工智能

人工智能(Artificial Intelligence,AI)指通过计算机系统模拟人类智能的技术与科学,涵盖学习、推理、感知、决策等能力。其核心目标是让机器执行通常需要人类智能的任务,如语言理解、图像识别、问题解决等。

简单来说就是----仿智;像人一样机器智能的综合与分析;机器模拟代替人类

2.人工智能三大概念

三者关系

机器学习是实现人工智能的一种方式,基于统计学

深度学习是机器学习的一种方法发展而来的,基于神经网络

3.什么是机器学习

让机器自动学习,而不是基于规则的编程(不依赖于特定规则编程)

4.什么是深度学习

深度学习也叫深度神经网络,大脑仿生,设计一层一层的神经元模仿万事万物

5.学习方式

1.基于规则的学习,专家系统,用手工的if-else方式进行的预测

2.基于模型的学习,从数据中自动学出规律

6.机器学习常用术语

1.样本:一行数据就是一个样本,多个样本组成数据集;有时一条样本被叫做一条记录

2.特征:一列数据一个特征,有时也被称为属性,特征是从数据中抽取出来的,对结果预测有用的信息

3.标签/目标:模型要预测的那一列数据

x_train训练集中的数据(特征) y_train训练集中的标签(目标值)

x_test测试集中的数据(特征) y_test测试集中的标签(目标值)

7.数据集的划分

1.训练集:用来训练模型的数据集

2.测试集:用来测试模型的数据集

一般训练集/测试集==8/2或7/3

8.机器学习算法分类

8.1有监督学习

定义 :输入数据是由输入特征值和目标值所组成,即输入的训练数据有标签的

数据集:需要标注数据的标签/目标

有监督学习分为分类问题和回归问题

分类问题:

目标值(标签值)是不连续的,具体的类别(优秀,良好,差)

分类种类:二分类,多分类

回归问题:

目标值(标签值)是连续的(数字)

8.2无监督学习

定义:输入数据没有被标记,即样本数据类型未知,没有标签,根据样本间的相似性,对样本集聚类,以发现事物内部结构及相互关系

数据集:不需要标注数据

特点:1.训练数据无标签

2.根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系

8.3半监督学习

拿有标记的数据训练模型,然后拿训练好的模型对未标记的数据进行预测,然后人为的去校准

8.3强化学习

基本原理:通过构建四个要素:Agent,环境状态,行动,奖励,Agent根据环境状态进行行动获得更多的累积奖励

小孩子学走路的过程

(1)小孩子就是Agent,他试图通过采取行动(即行走),来操纵环境(行走的地面)

(2)并且从一个状态转化到另一个状态(他走的每一步)

(3)当他完成任务的子任务时,孩子得到奖励(吃糖)

(4)并且他不能走路时,就不会得到巧克力

相关推荐
大龄程序员狗哥2 小时前
第47篇:使用Speech-to-Text API快速构建语音应用(操作教程)
人工智能
KKKlucifer2 小时前
数据安全合规自动化:策略落地、审计追溯与风险闭环技术解析
人工智能·安全
RWKV元始智能3 小时前
RWKV超并发项目教程,RWKV-LM训练提速40%
人工智能·rnn·深度学习·自然语言处理·开源
dyj0953 小时前
Dify - (一)、本地部署Dify+聊天助手/Agent
人工智能·docker·容器
墨染天姬3 小时前
【AI】Hermes的GEPA算法
人工智能·算法
小超同学你好3 小时前
OpenClaw 深度解析系列 · 第8篇:Learning & Adaptation(学习与自适应)
人工智能·语言模型·chatgpt
紫微AI3 小时前
前端文本测量成了卡死一切创新的最后瓶颈,pretext实现突破了
前端·人工智能·typescript
码途漫谈3 小时前
Easy-Vibe开发篇阅读笔记(四)——前端开发之结合 Agent Skills 美化界面
人工智能·笔记·ai·开源·ai编程
易连EDI—EasyLink3 小时前
易连EDI–EasyLink实现OCR智能数据采集
网络·人工智能·安全·汽车·ocr·edi
冬奇Lab3 小时前
RAG 系列(二):用 LangChain 搭建你的第一个 RAG Pipeline
人工智能·langchain·llm