PYTHON+AI LLM DAY SEVENTY-TWO

今天细致聊一下Bert架构.前面也提到过自然语言处理(NLP)的概念就是让计算机能够理解和生成人类语言的过程.于是基于理解的方向就是Bert架构,基于生成的方向就是GPT方向.Bert架构的核心部分分为三个部分.分别是Embbedding模块,Transformer模块,预微调模块.Embbeding模块是三种Embedding共同构成.Token Embeddings:词嵌入张量,第一个位置是"cls".Segment Embedding:句子分段嵌入张量:同样,第一个位置是"cls"表示句子的开始,后面跟着的是一系列数字,这些数字来自于bert模型专有的词表的索引序列.过程就是根据你输入的句子,根据句子里面的词去匹配词表里面的索引序列,最后是一个结束的标志,代表一段句子的结束.Position Embedding:位置编码张量:这里不同于传统transformer位置编码,这里采用的是相对位置编码.可以缓解位置信息丢失问题,保持语境的顺序敏感性.Transformer模块:这里是transforem模块的编码器部分,根据base模式,12层,large模式24层.预微调模块:用来完成指定任务的输出.在经过上一层的输出.预微调模块.的几种微调任务:输入两个句子,判断两个句子关系(分类关系).输入一个句子进行分类.判断情感分类.输入一个问答对,在问题里面去找答案.阅读理解.输入一个句子进行token级别分类.

相关推荐
Stick_ZYZ1 小时前
A2A:让 Agent 从单兵作战走向团队协作
java·开发语言·网络·人工智能·python·ai
weixin_495248401 小时前
短剧漫剧批量译制全流程指南:短剧漫剧如何规模化译制?
人工智能
JAMSAN09301 小时前
16.0% 高增长!全球异构计算架构服务市场扩容态势
汇编·人工智能·架构
weixin_307779131 小时前
从切片迷宫到结构化智能:AI Agent解析PDF的完整范式
图像处理·人工智能·python·自动化·ocr
源码宝1 小时前
智能随访系统源码,技术架构设计:Spring Boot + Vue.js + 微服务实战
java·人工智能·源码·随访系统·智能随访·随访系统成品源码
zhqh1001 小时前
MOT16数据集做目标检测的预处理(类别合并与清理)
人工智能·目标检测·计算机视觉
BizViewStudio1 小时前
2026 年 GEO 成为企业线上流量增长核心风口|2026 品牌 GEO 运营指南,6 家全链路优化服务商解析
运维·网络·人工智能·microsoft·ai
benben0441 小时前
ONNX从入门到精通大全
人工智能·pytorch·python
码农阿强2 小时前
Claude-Fable-5 技术详解 + 基于 startapi.top 接口实战调用(附多语言代码示例)
人工智能·gpt·ai·aigc·ai编程