Ai大模型day02神经网络+深度学习

(Aritifcial) Neuron神经网络

Training Objective训练神经网络

缩小损失函数,参数对梯度进行改变,降低损失

Word2Vec 神经网络训练

使用滑动窗口构建

RNN 循环神经网络

门控机制,决定哪些信息传到下一层

CNN 卷积神经网络语言模型

应用NLP、情感分类

cnn和rnn区别

cnn局部处理特征,rnn擅长处理变长的文本,rnn参数两比cnn多一些。rnn前后数据有很强以来关系,不能进行并行化计算。解决办法,用transformer进行加速运算

cnn是数据向量化,前后数据没有很强依赖关系。

NLP Pipeline Tutorial(PyTorch)案例

数据训练流程

1.准备数据

2.建立模型

3.训练模型

4.验证模型

5.测试模型

cross_entropy是一个常用的用于分类的目标函数。

相关推荐
是Yu欸3 分钟前
DevUI MateChat 技术演进:UI 与逻辑解耦的声明式 AI 交互架构
前端·人工智能·ui·ai·前端框架·devui·metachat
我不是QI12 分钟前
周志华《机器学习---西瓜书》 一
人工智能·python·机器学习·ai
H***997630 分钟前
月之暗面公开强化学习训练加速方法:训练速度暴涨97%,长尾延迟狂降93%
人工智能·深度学习·机器学习
二川bro37 分钟前
Python在AI领域应用全景:2025趋势与案例
开发语言·人工智能·python
AI-智能42 分钟前
RAG 系统架构设计模式介绍
人工智能·langchain·llm·agent·知识库·rag·大模型应用
长桥夜波44 分钟前
机器学习日报20
人工智能·机器学习
字节跳动视频云技术团队1 小时前
火山引擎多媒体实验室AIGC视频画质理解大模型VQ-Insight入选AAAI 2025 Oral
人工智能
谢景行^顾1 小时前
初识机器学习
人工智能
AI工具学习测评1 小时前
实测五款AI生成PPT工具,这款国产软件让我工作效率翻倍!
人工智能·powerpoint
Akamai中国1 小时前
提升 EdgeWorker 可观测性:使用 DataStream 设置日志功能
人工智能·云计算·云服务