人工智能之机器学习概念3【培训机构学习笔记】

定义及作用:

  • 无监督学习 是通过试图学习或提取数据背后的数据特征,或者从数据中抽取出重要的特征信息,常见的算法有**类聚、降维、文本处理(特征抽取)**等。
  • 无监督学习 一般是作为有监督学习的前期数据处理功能是从原始数据中抽取必要的标签信息
  • 半监督学习(SSL): 利用少量标注样本大量的未标注样本进行训练。
  • **强化学习:**通过激励学习

机器学习、人工智能和深度学习的关系

  • 深度学习是机器学习的子类;
  • 深度学习是基于传统的神经网络算法发展到多隐层的一种算法体现;
  • 机器学习又是人工智能的一个子类。

机器学习开发流程

  • 数据收集
  • 数据预处理
  • 特征提取
  • 模型构建
  • 模型测试评估
  • 投入使用(模型部署与整合)
  • 迭代优化
  • 注意数据的脱敏性

数据清洗和转换

  • 对数据进行初步的预处理,转换为适合的格式,一般为:向量或者矩阵

常用的方法

  • 将类别数据编码转变为对应的数值表示(一般使用1-of-k\哑编码方法(one-hot))
  • 从文本数据中提取有用的数据(一般使用词袋法或者TF-IDF)
  • 处理图像或者音频数据(傅里叶变换)
  • 对特征数据进行正则化、标准化,以保证格式、单位一致
  • 对数与指数之间的转换
  • 将现有变量进行组合或转换以生成新的特征。
相关推荐
一 铭1 小时前
AI领域新趋势:从提示(Prompt)工程到上下文(Context)工程
人工智能·语言模型·大模型·llm·prompt
麻雀无能为力4 小时前
CAU数据挖掘实验 表分析数据插件
人工智能·数据挖掘·中国农业大学
时序之心4 小时前
时空数据挖掘五大革新方向详解篇!
人工智能·数据挖掘·论文·时间序列
.30-06Springfield5 小时前
人工智能概念之七:集成学习思想(Bagging、Boosting、Stacking)
人工智能·算法·机器学习·集成学习
说私域6 小时前
基于开源AI智能名片链动2+1模式S2B2C商城小程序的超级文化符号构建路径研究
人工智能·小程序·开源
永洪科技6 小时前
永洪科技荣获商业智能品牌影响力奖,全力打造”AI+决策”引擎
大数据·人工智能·科技·数据分析·数据可视化·bi
shangyingying_16 小时前
关于小波降噪、小波增强、小波去雾的原理区分
人工智能·深度学习·计算机视觉
码荼7 小时前
学习开发之hashmap
java·python·学习·哈希算法·个人开发·小白学开发·不花钱不花时间crud
书玮嘎7 小时前
【WIP】【VLA&VLM——InternVL系列】
人工智能·深度学习
猫头虎7 小时前
猫头虎 AI工具分享:一个网页抓取、结构化数据提取、网页爬取、浏览器自动化操作工具:Hyperbrowser MCP
运维·人工智能·gpt·开源·自动化·文心一言·ai编程