机器学习的两种典型任务

机器学习中的典型任务类型可以分为分类任务(Classification)和回归任务(Regression)

分类任务

回归任务

简单的理解,分类任务是对离散值进行预测,根据每个样本的值/特征预测该样本属于类 型A、类型B 还是类型C,例如情感分类、内容审核,相当于学习了一个分类边界(决策 边界),用分类边界把不同类别的数据区分开来。 回归任务是对连续值进行预测,根据每个样本的值/特征预测该样本的具体数值,例如房 价预测,股票预测等,相当于学习到了这一组数据背后的分布,能够根据数据的输入预 测该数据的取值。

有监督学习:监督学习利用大量的标注数据来训练模型,对模型的预测值和数据的真实 标签计算损失,然后将误差进行反向传播(计算梯度、更新参数),通过不断的学习, 最终可以获得识别新样本的能力。

每条数据都有正确答案,通过模型预测结果与正确答案的误差不断优化模型参数

无监督学习:无监督学习不依赖任何标签值,通过对数据内在特征的挖掘,找到样本间 的关系,比如聚类相关的任务。有监督和无监督最主要的区别在于模型在训练时是否需 要人工标注的标签信息。

只有数据没有答案,常见的是聚类算法,通过衡量样本之间的距离来划分类别

半监督学习:利用有标签数据和无标签数据来训练模型。一般假设无标签数据远多于有 标签数据。例如使用有标签数据训练模型,然后对无标签数据进行分类,再使用正确分 类的无标签数据训练模型;

利用大量的无标注数据和少量有标注数据进行模型训练

自监督学习:机器学习的标注数据源于数据本身,而不是由人工标注。目前主流大模型 的预训练过程都是采用自监督学习,将数据构建成完型填空形式,让模型预测对应内容, 实现自监督学习。

通过对数据进行处理,让数据的一部分成为标签,由此构成大规模数据进行模型训练

远程监督学习:主要用于关系抽取任务,采用bootstrap的思想通过已知三元组在文本 中寻找共现句,自动构成有标签数据,进行有监督学习。

基于现有的三元组收集训练数据,进行有监督学习

强化学习:强化学习是智能体根据已有的经验,采取系统或随机的方式,去尝试各种可 能答案的方式进行学习,并且智能体会通过环境反馈的奖赏来决定下一步的行为,并为 了获得更好的奖赏来进一步强化学习。

以获取更高的环境奖励为目标优化模型

相关推荐
天一生水water2 分钟前
页岩油生产流程案例
人工智能·智慧油田
Yeliang Wu9 分钟前
算力自由:用K8s和Ollama打造你的专属AI基础设施
人工智能·容器·kubernetes
*星星之火*13 分钟前
【大白话 AI 答疑】第6篇 大模型指令微调:instruction/input/output核心解析及案例
服务器·前端·人工智能
元智启14 分钟前
企业级AI智能体开发:从概念到落地的关键技术实践
人工智能
AI指北17 分钟前
每周AI看 | 亚马逊推出AI产品矩阵、网易云商客服Agent项目收录至《2025年中国数字服务产业发展白皮书》
人工智能·ai·ai agent·ai热点
skywalk816327 分钟前
GLM-edge-1.5B-chat 一个特别的cpu可以推理的小型llm模型
人工智能·ollama·llama.cpp
TsingtaoAI29 分钟前
TsingtaoAI荣膺2025澳门首届DSA国际创新创业大赛奖项,RISC-V AI机器人引领行业新突破
人工智能·机器人·risc-v
CClaris31 分钟前
手撕 LSTM:用 NumPy 从零实现 LSTM 前向传播
人工智能·numpy·lstm
夜幕龙41 分钟前
宇树 G1 部署(十一)——遥操作脚本升级 teleop_hand_and_arm_update.py
人工智能·机器人·具身智能
币之互联万物42 分钟前
聚焦新质生产力 科技与金融深度融合赋能创新
人工智能·科技·金融