002-基于Sklearn的机器学习入门:基本概念

本节将继续介绍与机器学习有关的一些基本概念,包括机器学习的分类,性能指标等。同样,如果你对本节内容很熟悉,可直接跳过。

2.1 机器学习概述

2.1.1 什么是机器学习

常见的监督学习方法

2.1.2 机器学习的分类

机器学习一般包括监督学习,无监督学习,强化学习,半监督学习和主动学习,接下来,我们主要针对每一种学习方法进行解释。

  • 监督学习:简单的来说,监督学习,就是我们人为的给我们的数据集添加一个标注,使得我们的机器学习模型可以借助外力从我们的数据中去学习。标注数据表示我们的输入与输出的对应关系,我们建立的模型,对给定的新数据集,产生相应的输出,监督学习的本质就是学习输入到输出的映射规律。
  • 无监督学习:无监督学习是指从无标注的数据集中进行学习预测的机器学习,它和监督学习刚好相反,监督学习需要我们人为的添加标注,而无监督学习不需要我们人为的添加标注,模型会自动从给定的数据集中学习,然后对我们给出的新的数据集进行预测判断,无监督学习本质是学习数据中统计规律和潜在的结构。
  • 强化学习:强化学习是指智能系统在与环境的连续互动中学习最优行为策略的机器学习问题。
  • 半监督学习:半监督学习是指利用标注数据和未标注数据学习预测模型的机器学习问题,通过有少量的标注数据,大量的未标注数据,半监督学习的目的是在利用未标注数据中的信息,辅助标注数据进行监督的学习以较低的成本达到较好的学习效果。
  • 主动学习:主动学习是指机器不断主动给出实例让教师进行标注,然后利用标注数据学习预测模型的机器学习问题,通常监督学习使用给定的标注数据集,往往是随机得到的,可以看做是被动学习,主动学习的目标是找出对学习有帮助的实例让教师标注,以较小的标注代价,达到较好的学习效果。

2.3 性能度量

机器学习概论_假设空间定义为决策函数的集合-CSDN博客

相关推荐
腾讯云开发者1 小时前
港科大熊辉|AI时代的职场新坐标——为什么你应该去“数据稀疏“的地方?
人工智能
工程师老罗1 小时前
YoloV1数据集格式转换,VOC XML→YOLOv1张量
xml·人工智能·yolo
喵手2 小时前
Python爬虫实战:旅游数据采集实战 - 携程&去哪儿酒店机票价格监控完整方案(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集结果csv导出·旅游数据采集·携程/去哪儿酒店机票价格监控
Coder_Boy_2 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
2501_944934732 小时前
高职大数据技术专业,CDA和Python认证优先考哪个?
大数据·开发语言·python
啊森要自信2 小时前
CANN ops-cv:面向计算机视觉的 AI 硬件端高效算子库核心架构与开发逻辑
人工智能·计算机视觉·架构·cann
helloworldandy2 小时前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
2401_836235862 小时前
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因
人工智能·科技·深度学习·ocr·生活
njsgcs2 小时前
llm使用 AgentScope-Tuner 通过 RL 训练 FrozenLake 智能体
人工智能·深度学习