【大模型】大模型学习总结之机器学习 - 1.基础知识

这里写目录标题

1. 机器学习概述

1、什么是机器学习?

机器学习(Machine Learning, ML)主要研究计算机系统对于特定任务的性能,逐步进行改善的算法和统计模型。通过输入海量训练数据对模型进行训练,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类或预测。

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸优化、算法复杂度理论等多门学科。

要点速记:

机器学习是一种通过算法模型 使计算机从数据中自动学习 并进行预测决策的技术,属于人工智能的一个分支。

2、 人工智能、机器学习、深度学习的关系?

人工智能、机器学习与深度学习三者之间存在明确的层级包含关系:‌人工智能(AI)是一个宏大的目标领域,旨在让机器具备类人智能;机器学习(ML)是实现人工智能目标的一种核心方法,它让机器通过数据来学习;而深度学习(DL)则是机器学习领域内一个重要的分支或技术,特指基于深层神经网络的学习方法,能够自动从数据中提取复杂特征。‌‌‌

要点速记:

总而言之,人工智能包含机器学习,机器学习是人工智能的一个分支;机器学习又分为 监督学习、非监督学习、半监督学习、深度学习,所以 机器学习又包含深度学习。

3、机器学习的应用领域

今天,在计算机科学的诸多分支学科领域中,无论是多媒体、图形学,还是网络通信、软件工程,乃至体系结构、芯片设计,都能找到机器学习技术的身影,尤其是在计算机视觉、自然语言处理等计算机应用技术领域,机器学习已成为最重要的技术进步源泉之一,并为许多交叉学科提供了重要的技术支撑。

2. 机器学习基本理论

1、 机器学习的三要素?

机器学习的三要素是‌模型‌、‌策略‌和‌算法‌,它们构成了从问题定义到求解的完整框架,是理解和构建机器学习系统的核心基石。‌‌

模型:解决问题的假设形式

模型定义了机器学习系统能够理解和解决的问题类型,它是对数据中未知规律的假设。‌‌

‌作用与类型‌:模型的核心作用是将输入数据映射到输出结果。常见的模型包括线性模型(如线性回归)和非线性模型(如神经网络)。线性模型假设输入和输出之间存在线性关系,

非线性模型则通过引入非线性基函数(如 ϕ(x))来捕捉更复杂的特征关系

参数与超参数‌:模型本身包含需要从数据中学习的参数以及用于定义模型结构或优化策略的超参数(如神经网络层数),后者通常需要基于经验或搜索来设定。‌‌

策略:评估与指导学习的准则

策略决定了如何从数据中学习模型,它为模型训练提供了目标和评估标准。‌‌

算法:求解最优参数的具体方法

2、 机器学习的分类?


3、总结监督学习建模的整体流程如下:

可以看到,机器学习是由数据驱动的,核心是利用数据来"训练模型";模型训练的结果需要用一定的方法来进行评估、优化,最终得到一个成熟的学习模型;最后就可以用这个模型来进行预测和解决问题了

3. 机器学习的基本术语

  • 数据集(Data Set):多条记录的集合。
    • 训练集(Training Set):用于训练模型的数据。
    • 验证集(Validation Set):用于调节超参数的数据。
    • 测试集(Test Set):用于评估模型性能的数据。
  • 样本(Sample):数据集中的一条记录是关于一个事件或对象的描述,称为一个样本。
  • 特征(Feature):数据集中一列反映事件或对象在某方面的表现或性质的事项,称为特征或属性。
  • 特征向量(Feature Vector):将样本的所有特征表示为向量的形式,输入到模型中。
  • 标签(Label):监督学习中每个样本的结果信息,也称作目标值(target)。
  • 模型(Model):一个机器学习算法与训练后的参数集合,用于进行预测或分类。
  • 参数(Parameter):模型通过训练学习到的值,例如线性回归中的权重和偏置。
  • 超参数(Hyper Parameter):由用户设置的参数,不能通过训练自动学习,例如学习率、正则化系数等。
相关推荐
Thomas.Sir1 小时前
第一章:Agent智能体开发实战之【初步认识 LlamaIndex:从入门到实操】
人工智能·python·ai·检索增强·llama·llamaindex
笨笨饿1 小时前
29_Z变换在工程中的实际意义
c语言·开发语言·人工智能·单片机·mcu·算法·机器人
boy快快长大1 小时前
【大模型应用开发】记忆
人工智能
LaughingZhu1 小时前
Product Hunt 每日热榜 | 2026-04-05
前端·数据库·人工智能·经验分享·神经网络
OPHKVPS1 小时前
GoBruteforcer(GoBrut)僵尸网络新攻势:AI 生成弱配置成“帮凶”,瞄准加密货币及区块链数据库
网络·人工智能·区块链
Amazing_Cacao1 小时前
深度观察 | 从“产区玄学”到“液态战场”:精品巧克力的终极试金石
学习
打乒乓球只会抽2 小时前
AI Agent:大模型+工具的智能革命
人工智能
Pelb2 小时前
求导 y = f(x) = x^2
人工智能·深度学习·神经网络·数学建模
workflower2 小时前
注塑机行业目前自动化现状分析
运维·人工智能·语言模型·自动化·集成测试·软件工程·软件需求
深蓝海拓2 小时前
S7-1500PLC学习笔记:MOVE_BLK、MOVE_BLK_VARIANT、BLKMOV的区别
笔记·学习·plc