Ai大模型day02神经网络+深度学习

(Aritifcial) Neuron神经网络

Training Objective训练神经网络

缩小损失函数,参数对梯度进行改变,降低损失

Word2Vec 神经网络训练

使用滑动窗口构建

RNN 循环神经网络

门控机制,决定哪些信息传到下一层

CNN 卷积神经网络语言模型

应用NLP、情感分类

cnn和rnn区别

cnn局部处理特征,rnn擅长处理变长的文本,rnn参数两比cnn多一些。rnn前后数据有很强以来关系,不能进行并行化计算。解决办法,用transformer进行加速运算

cnn是数据向量化,前后数据没有很强依赖关系。

NLP Pipeline Tutorial(PyTorch)案例

数据训练流程

1.准备数据

2.建立模型

3.训练模型

4.验证模型

5.测试模型

cross_entropy是一个常用的用于分类的目标函数。

相关推荐
Yo_Becky12 分钟前
【PyTorch】PyTorch预训练模型缓存位置迁移,也可拓展应用于其他文件的迁移
人工智能·pytorch·经验分享·笔记·python·程序人生·其他
DeepSeek-大模型系统教程14 分钟前
深入金融与多模态场景实战:金融文档分块技术与案例汇总
人工智能·ai·语言模型·程序员·大模型·大模型学习·大模型教程
xinxiangwangzhi_19 分钟前
pytorch底层原理学习--PyTorch 架构梳理
人工智能·pytorch·架构
yzx99101324 分钟前
关于网络协议
网络·人工智能·python·网络协议
AiTEN_Robot25 分钟前
AGV 无人叉车关键技术问题解析:精准定位算法 / 安全避障逻辑 / 系统对接协议全方案
人工智能·机器人·自动化·制造
云天徽上26 分钟前
【PaddleOCR】OCR常见关键信息抽取数据集,包含FUNSD、XFUND、WildReceipt等整理,持续更新中......
人工智能·计算机视觉·信息可视化·paddlepaddle·paddleocr·文本识别
zskj_zhyl27 分钟前
智绅科技:以科技为翼,构建养老安全守护网
人工智能·科技·安全
刘海东刘海东28 分钟前
结构型智能科技的关键可行性——信息型智能向结构型智能的转换(提纲)
人工智能
Jay Kay1 小时前
TensorFlow源码深度阅读指南
人工智能·python·tensorflow
FF-Studio1 小时前
【硬核数学 · LLM篇】3.1 Transformer之心:自注意力机制的线性代数解构《从零构建机器学习、深度学习到LLM的数学认知》
人工智能·pytorch·深度学习·线性代数·机器学习·数学建模·transformer