Ai大模型day02神经网络+深度学习

(Aritifcial) Neuron神经网络

Training Objective训练神经网络

缩小损失函数,参数对梯度进行改变,降低损失

Word2Vec 神经网络训练

使用滑动窗口构建

RNN 循环神经网络

门控机制,决定哪些信息传到下一层

CNN 卷积神经网络语言模型

应用NLP、情感分类

cnn和rnn区别

cnn局部处理特征,rnn擅长处理变长的文本,rnn参数两比cnn多一些。rnn前后数据有很强以来关系,不能进行并行化计算。解决办法,用transformer进行加速运算

cnn是数据向量化,前后数据没有很强依赖关系。

NLP Pipeline Tutorial(PyTorch)案例

数据训练流程

1.准备数据

2.建立模型

3.训练模型

4.验证模型

5.测试模型

cross_entropy是一个常用的用于分类的目标函数。

相关推荐
Saniffer_SH3 分钟前
【高清视频】Gen6 服务器还没到,Gen6 SSD 怎么测?Emily 现场演示三种测试环境
人工智能·驱动开发·测试工具·缓存·fpga开发·计算机外设·压力测试
ZHW_AI课题组8 分钟前
Python 调用百度智能云 API 实现地址识别
开发语言·人工智能·python·机器学习·百度·数据挖掘
俊哥V8 分钟前
每日 AI 研究简报 · 2026-06-15
人工智能·ai
王木风19 分钟前
Spring Boot + LLM 工程化:把短视频流水线拆成 16 个独立角色的踩坑记录
人工智能·spring boot·后端·开源·新媒体运营·音视频·agent
信实翻译20 分钟前
分账模式翻译:跨越商业与语言的精密计算
人工智能
EAIReport23 分钟前
企业级AI智能体平台说明
人工智能
智海观潮25 分钟前
UniScientist:30B开源科研大模型突破,重构AI自主研究范式
人工智能·ai·大模型
chen_zn9528 分钟前
VLA 的 Co-training:通过多源数据提升机器人泛化能力
人工智能·深度学习·具身智能·vla
AI客栈28 分钟前
K8s 调度器扩展:从 Scheduling Framework 到自定义插件的工程实战
人工智能
大模型最新论文速读39 分钟前
06-15 · LLM 最新论文速览
论文阅读·人工智能·深度学习·自然语言处理