机器学习(笔记)

1. 人工智能

1.1 人工智能三要素

人工智能有三要素:数据、算法、计算力。

1.2 CPU和GPU

CPU主要适合I\O密集型的任务,主要是输入和输出。

GPU主要适合计算密集型的任务。

1.3 什么样的程序适合在GPU上运行

计算密集型的程序和易于并行的程序

1.4 人工智能、机器学习、深度学习的关系

机器学习是人工智能的一个实现途径。

深度学习是机器学习的一个方法(神经网络)发展而来的。

2. 机器学习

2.1 什么是机器学习

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

2.2 机器学习工作流程

机器学习的工作流程:

  1. 获取数据
  2. 数据基本数据
  3. 特征工程
  4. 机器学习(模型训练)
  5. 模型评估(达到要求后,就可以上线服务。达不到要求就重复2~5)

2.2.1 数据集

数据集是由特征值和目标值构成,然而部分数据集也存在没有目标值的情况。例如:分类

数据集中一行数据称为一个样本,一列数据称为一个特征。

数据集分为训练数据和测试数据,一般训练数据占比为70%~80%,测试数据占比为20%~30%

2.2.2 模型评估

模型评估中会出现,过拟合和欠拟合。

过拟合是指,学的特征太多,不好泛化。

欠拟合是指,学的特征太少。

3. jupyter notebook安装

3.1 环境变量

在磁盘中创建一个文件夹,例如:G:\AI

创建一个系统变量WORKON_HOME,变量值为新建的文件夹

3.2 安装virtualenv和virtualenvwrapper-win

powershell 复制代码
pip install virtualenv
pip install virtualenvwrapper-win

安装完成后,在新建的目录下面,用管理员的方式打开cmd,然后执行mkvirtualenv ai

此时会新建一个ai的虚拟环境,在对应的目录下面会新增一个ai的文件夹。

3.3 安装相关Python库

进入ai虚拟环境,命令为:workon ai

powershell 复制代码
pip install matplotlib
pip install numpy
pip install pandas
pip install tables
pip install jupyter

3.4 执行jupyter

首先要进入虚拟环境,然后运行jupyter

powershell 复制代码
workon ai
jupyter notebook

然后访问http://localhost:8888/tree就可以打开了。

3.5 汉化

安装语言包:pip install jupyterlab-language-pack-zh-CN

相关推荐
Kel4 分钟前
Claude Code 架构深度剖析:从终端输入到大模型响应的完整过程
人工智能·设计模式·架构
降临-max6 分钟前
Git 协同开发与冲突解决
笔记·git
taWSw5OjU16 分钟前
从模型评估、梯度难题到科学初始化:一步步解析深度学习的训练问题
人工智能·深度学习
刘佬GEO17 分钟前
【无标题】
网络·人工智能·搜索引擎·ai·语言模型
用户20187928316724 分钟前
/export之一个程序员与AI的“破案笔记”
人工智能
Ricardo-Yang31 分钟前
SCNP语义分割边缘logits策略
数据结构·人工智能·python·深度学习·算法
新缸中之脑39 分钟前
微调BERT进行命名实体识别
人工智能·深度学习·bert
用户20187928316741 分钟前
故事:小白的“无限循环”噩梦与大师的 /loop 魔法
人工智能
段小二41 分钟前
Token 费用失控、VIP 用户体验一样烂:Context Engineering 才是关键
人工智能·后端
用户20187928316743 分钟前
/branch 你点了一份代码,Cli 帮你分成了两碗
人工智能