机器学习(笔记)

1. 人工智能

1.1 人工智能三要素

人工智能有三要素:数据、算法、计算力。

1.2 CPU和GPU

CPU主要适合I\O密集型的任务,主要是输入和输出。

GPU主要适合计算密集型的任务。

1.3 什么样的程序适合在GPU上运行

计算密集型的程序和易于并行的程序

1.4 人工智能、机器学习、深度学习的关系

机器学习是人工智能的一个实现途径。

深度学习是机器学习的一个方法(神经网络)发展而来的。

2. 机器学习

2.1 什么是机器学习

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

2.2 机器学习工作流程

机器学习的工作流程:

  1. 获取数据
  2. 数据基本数据
  3. 特征工程
  4. 机器学习(模型训练)
  5. 模型评估(达到要求后,就可以上线服务。达不到要求就重复2~5)

2.2.1 数据集

数据集是由特征值和目标值构成,然而部分数据集也存在没有目标值的情况。例如:分类

数据集中一行数据称为一个样本,一列数据称为一个特征。

数据集分为训练数据和测试数据,一般训练数据占比为70%~80%,测试数据占比为20%~30%

2.2.2 模型评估

模型评估中会出现,过拟合和欠拟合。

过拟合是指,学的特征太多,不好泛化。

欠拟合是指,学的特征太少。

3. jupyter notebook安装

3.1 环境变量

在磁盘中创建一个文件夹,例如:G:\AI

创建一个系统变量WORKON_HOME,变量值为新建的文件夹

3.2 安装virtualenv和virtualenvwrapper-win

powershell 复制代码
pip install virtualenv
pip install virtualenvwrapper-win

安装完成后,在新建的目录下面,用管理员的方式打开cmd,然后执行mkvirtualenv ai

此时会新建一个ai的虚拟环境,在对应的目录下面会新增一个ai的文件夹。

3.3 安装相关Python库

进入ai虚拟环境,命令为:workon ai

powershell 复制代码
pip install matplotlib
pip install numpy
pip install pandas
pip install tables
pip install jupyter

3.4 执行jupyter

首先要进入虚拟环境,然后运行jupyter

powershell 复制代码
workon ai
jupyter notebook

然后访问http://localhost:8888/tree就可以打开了。

3.5 汉化

安装语言包:pip install jupyterlab-language-pack-zh-CN

相关推荐
池央20 分钟前
AI性能极致体验:通过阿里云平台高效调用满血版DeepSeek-R1模型
人工智能·阿里云·云计算
我们的五年21 分钟前
DeepSeek 和 ChatGPT 在特定任务中的表现:逻辑推理与创意生成
人工智能·chatgpt·ai作画·deepseek
Yan-英杰22 分钟前
百度搜索和文心智能体接入DeepSeek满血版——AI搜索的新纪元
图像处理·人工智能·python·深度学习·deepseek
Fuweizn24 分钟前
富唯智能可重构柔性装配产线:以智能协同赋能制造业升级
人工智能·智能机器人·复合机器人
taoqick2 小时前
对PosWiseFFN的改进: MoE、PKM、UltraMem
人工智能·pytorch·深度学习
suibian52352 小时前
AI时代:前端开发的职业发展路径拓宽
前端·人工智能
CSDN_PBB3 小时前
[STM32 - 野火] - - - 固件库学习笔记 - - - 十五.设置FLASH的读写保护及解除
笔记·stm32·学习
预测模型的开发与应用研究3 小时前
数据分析的AI+流程(个人经验)
人工智能·数据挖掘·数据分析
源大模型3 小时前
OS-Genesis:基于逆向任务合成的 GUI 代理轨迹自动化生成
人工智能·gpt·智能体
PowerBI学谦5 小时前
Python in Excel高级分析:一键RFM分析
大数据·人工智能·pandas