阿里云人工智能工程师ACA认证免费课程学习笔记
- [0. 引言](#0. 引言)
- 第1章:人工智能基础
- 第2章:机器学习PAI平台基础
- 第3章:数据处理基础
- 第4章:机器学习基础
- 第5章:深度学习基础
- 第7章:自然语言处理基础
0. 引言
这里记录了部分阿里云人工智能工程师ACA认证免费课程的截图,方便我个人查阅。
第1章:人工智能基础
课时1:人工智能概述
课时2:人工智能产业结构
课时3:人工智能项目开发的基本流程
第2章:机器学习PAI平台基础
略
第3章:数据处理基础
课时8:数据采集
课时9:数据可视化
课时10:数据标注
边框需要贴合物体
第4章:机器学习基础
课时11:机器学习概述
- 机器学习是使用算法解析数据
- 深度学习是采用多层非线性函数(神经网络)学习数据特征
- 利用已有的数据开发可以用来对新数据进行预测的模型
- 主要研究能产生模型的算法
- 一种以 "试错" 的方式进行学习,通过与环境交互获得的奖赏指导行为。
- 分类:预测变量是离散的。
- 回归:预测变量是连续的。
- 用来估量模型的预测值与真实值的不一致程度
- 优化函数通过调节参数使误差函数值变小
- 梯度下降:Gradient Descent
- 适用性梯度算法:使用学习率动态调整参数
- 均方根传播算法和AdaDelta算法:也是在学习率上做优化的
- Adam算法:可以看做是动量优化法和均方根传播算法的结合,自适应的调整学习率
- MBGD:n一般选择10。batch size选择不好的话,可能会带来一些问题。
- 对角线是分类正确的值,对角线以外都是分类错误的。
课时12:机器学习经典算法介绍
- 两种叫做二元线性回归,两种以上叫做多元线性回归。
- 需要先确定数据是否是线性关系
- 加上对系数的惩罚项
- 添加非线性变换
- Softmax:激活函数
- Softmax:另一个说法是归一化指数函数
- 找到最大边距超平面
- 径向基核函数用的最多
- 决策树是由节点和分支构成的
- 难点是怎么从数据生成决策树
- 信息:能消除不确定内容的才叫信息
- ID3和C4.5是多叉树,CART是二叉树。样本量比较小的时候可以用C4.5,样本量比较大的使用CART算法。
- 有一点三个臭皮匠顶个诸葛亮的感觉
- 袋外数据:没有在训练时被抽中的数据。可以做为验证数据使用。
- 聚类属于无监督学习的一种
课时13:机器学习PAI平台简单实现
略
第5章:深度学习基础
课时14:深度学习概述
- 渐变是指梯度
- 对卷积神经网络的支持特别好
- torch是lua开发的
- pytorch是torch的python版
- caffe在计算机视觉的使用广泛
课时15:多层感知机
- 感知机只能解决单纯的线性问题
- 输入层,隐藏层,输出层
- 隐藏层可以有一层,可以有多层
- 存在梯度消失的情况
- 存在梯度消失的情况
- ReLU是现在目前最受欢迎的函数
- 有部分神经元在训练的时很脆弱
- 放在人工神经网络的隐藏层
- BP神经网络是一种按误差逆传播算法训练的多层神经网络
课时16:卷积神经网络
- 通过特征提取和分类是吧完成对输入数据的判别
- 2012年AlexNet网络取得成功,此后卷积神经网络被广泛用于各个领域
- AlexNet是第一个现代深度卷积网络模型
- 152层
- 使用了跳跃链接
- 缓解了梯度消失的问题
课时17:循环神经网络
- 多对多:最经典的RNN结构,输入和输出序列必须是等长的。
- LSTM:Long Short Term Memory
- 循环神经网络最著名和成功的拓展
- 门的结构很简单,就是一个Sigmoid层和一个点乘操作的组合
- 因为sigmoid层的输出是0-1的值,这代表有多少信息能够流过Sigmoid层
- 一个LTSM里面包含三个门来控制细胞状态
课时18:生成对抗网络
- 近年来复杂分布上无监督学习最具前景的方法之一。
- 判别模型(Discriminative Model)
- 最终达到的判别概率大概是0.5
课时19:机器学习PAI平台简单实现
略
第7章:自然语言处理基础
课时26:自然语言处理基本介绍
课时27:自然语言处理基础技术详细介绍
- BIOES
课时28:自然语言理解技术介绍与应用
课时29:自然语言生成技术介绍与应用
课时30:实验:自然语言处理简单实现
参考资料:
- 如果对课程感兴趣的话,请自行访问阿里云人工智能工程师ACA认证免费课程地址。