人工智能之机器学习概念3【培训机构学习笔记】

小白的程序空间2024-11-20 15:32

定义及作用：

无监督学习 是通过试图学习或提取数据背后的数据特征，或者从数据中抽取出重要的特征信息，常见的算法有**类聚、降维、文本处理（特征抽取）**等。
无监督学习 一般是作为有监督学习的前期数据处理 ，功能是从原始数据中抽取必要的标签信息。
半监督学习（SSL）： 利用少量标注样本 和大量的未标注样本进行训练。
**强化学习：**通过激励学习

机器学习、人工智能和深度学习的关系

深度学习是机器学习的子类；
深度学习是基于传统的神经网络算法发展到多隐层的一种算法体现；
机器学习又是人工智能的一个子类。

机器学习开发流程

数据收集
数据预处理
特征提取
模型构建
模型测试评估
投入使用（模型部署与整合）
迭代优化
注意数据的脱敏性

数据清洗和转换

对数据进行初步的预处理，转换为适合的格式，一般为：向量或者矩阵

常用的方法

将类别数据编码转变为对应的数值表示（一般使用1-of-k\哑编码方法（one-hot））
从文本数据中提取有用的数据（一般使用词袋法或者TF-IDF）
处理图像或者音频数据（傅里叶变换）
对特征数据进行正则化、标准化，以保证格式、单位一致
对数与指数之间的转换
将现有变量进行组合或转换以生成新的特征。

上一篇：Nuxt.js 应用中的 webpackConfigs 事件钩子

下一篇：23、论文阅读：基于多分辨率特征学习的层次注意力聚合GAN水下图像增强

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07【AI前线观察】2026年国产开源大模型全面横评：从 DeepSeek V4 到 Kimi K3，谁才是开发者的最优选择？08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 092026 年 AI 大模型 & AI 编程工具实战全总结 102026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？