1. 人工智能
1.1 人工智能三要素
人工智能有三要素:数据、算法、计算力。
1.2 CPU和GPU
CPU主要适合I\O密集型的任务,主要是输入和输出。
GPU主要适合计算密集型的任务。
1.3 什么样的程序适合在GPU上运行
计算密集型的程序和易于并行的程序
1.4 人工智能、机器学习、深度学习的关系
机器学习是人工智能的一个实现途径。
深度学习是机器学习的一个方法(神经网络)发展而来的。
2. 机器学习
2.1 什么是机器学习
机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测
2.2 机器学习工作流程
机器学习的工作流程:
- 获取数据
- 数据基本数据
- 特征工程
- 机器学习(模型训练)
- 模型评估(达到要求后,就可以上线服务。达不到要求就重复2~5)
2.2.1 数据集
数据集是由特征值和目标值构成,然而部分数据集也存在没有目标值的情况。例如:分类
数据集中一行数据称为一个样本,一列数据称为一个特征。
数据集分为训练数据和测试数据,一般训练数据占比为70%~80%,测试数据占比为20%~30%
2.2.2 模型评估
模型评估中会出现,过拟合和欠拟合。
过拟合是指,学的特征太多,不好泛化。
欠拟合是指,学的特征太少。
3. jupyter notebook安装
3.1 环境变量
在磁盘中创建一个文件夹,例如:G:\AI
创建一个系统变量WORKON_HOME,变量值为新建的文件夹
3.2 安装virtualenv和virtualenvwrapper-win
powershell
pip install virtualenv
pip install virtualenvwrapper-win
安装完成后,在新建的目录下面,用管理员的方式打开cmd,然后执行mkvirtualenv ai
此时会新建一个ai的虚拟环境,在对应的目录下面会新增一个ai的文件夹。
3.3 安装相关Python库
进入ai虚拟环境,命令为:workon ai
powershell
pip install matplotlib
pip install numpy
pip install pandas
pip install tables
pip install jupyter
3.4 执行jupyter
首先要进入虚拟环境,然后运行jupyter
powershell
workon ai
jupyter notebook
然后访问http://localhost:8888/tree就可以打开了。
3.5 汉化
安装语言包:pip install jupyterlab-language-pack-zh-CN