人工智能之机器学习概念3【培训机构学习笔记】

定义及作用:

  • 无监督学习 是通过试图学习或提取数据背后的数据特征,或者从数据中抽取出重要的特征信息,常见的算法有**类聚、降维、文本处理(特征抽取)**等。
  • 无监督学习 一般是作为有监督学习的前期数据处理功能是从原始数据中抽取必要的标签信息
  • 半监督学习(SSL): 利用少量标注样本大量的未标注样本进行训练。
  • **强化学习:**通过激励学习

机器学习、人工智能和深度学习的关系

  • 深度学习是机器学习的子类;
  • 深度学习是基于传统的神经网络算法发展到多隐层的一种算法体现;
  • 机器学习又是人工智能的一个子类。

机器学习开发流程

  • 数据收集
  • 数据预处理
  • 特征提取
  • 模型构建
  • 模型测试评估
  • 投入使用(模型部署与整合)
  • 迭代优化
  • 注意数据的脱敏性

数据清洗和转换

  • 对数据进行初步的预处理,转换为适合的格式,一般为:向量或者矩阵

常用的方法

  • 将类别数据编码转变为对应的数值表示(一般使用1-of-k\哑编码方法(one-hot))
  • 从文本数据中提取有用的数据(一般使用词袋法或者TF-IDF)
  • 处理图像或者音频数据(傅里叶变换)
  • 对特征数据进行正则化、标准化,以保证格式、单位一致
  • 对数与指数之间的转换
  • 将现有变量进行组合或转换以生成新的特征。
相关推荐
工藤学编程2 分钟前
AI Ping 赋能:基于 GLM-4.7(免费!)+ LangChain + Redis 打造智能AI聊天助手
人工智能·redis·langchain
程序员哈基耄3 分钟前
AI背景移除器:一键释放图像创造力
人工智能
fie88897 分钟前
基于 Matlab 实现的 语音分帧、端点检测、音高提取与DTW算法 结合的歌曲识别系统
人工智能·matlab
fruge9 分钟前
解锁AI开发新效率:AI Ping平台与免费明星模型MiniMax-M2.1、GLM-4.7深度解析
人工智能
natide10 分钟前
词汇/表达差异-7-Alias覆盖率
人工智能·pytorch·python·深度学习·自然语言处理
艾莉丝努力练剑10 分钟前
Al Ping免费上新:GLM-4.7 && MiniMaxM2.1重磅上线,附独家使用教程
java·大数据·linux·运维·人工智能·python
拉姆哥的小屋11 分钟前
智能婴儿床监控系统
人工智能·python·深度学习
ASKCOS11 分钟前
深度学习驱动的蛋白质设计新范式:解析RFdiffusion3与Foundry生态系统
人工智能·深度学习
Y.O.U..13 分钟前
GO学习-io包常用接口
开发语言·学习·golang
semantist@语校13 分钟前
第五十七篇|东京银星日本语学校的数据建模:高密度城市中的学习节律、制度边界与 Prompt 接口设计
大数据·数据库·人工智能·学习·百度·prompt·知识图谱