PYTHON+AI LLM DAY SEVENTY-TWO

今天细致聊一下Bert架构.前面也提到过自然语言处理(NLP)的概念就是让计算机能够理解和生成人类语言的过程.于是基于理解的方向就是Bert架构,基于生成的方向就是GPT方向.Bert架构的核心部分分为三个部分.分别是Embbedding模块,Transformer模块,预微调模块.Embbeding模块是三种Embedding共同构成.Token Embeddings:词嵌入张量,第一个位置是"cls".Segment Embedding:句子分段嵌入张量:同样,第一个位置是"cls"表示句子的开始,后面跟着的是一系列数字,这些数字来自于bert模型专有的词表的索引序列.过程就是根据你输入的句子,根据句子里面的词去匹配词表里面的索引序列,最后是一个结束的标志,代表一段句子的结束.Position Embedding:位置编码张量:这里不同于传统transformer位置编码,这里采用的是相对位置编码.可以缓解位置信息丢失问题,保持语境的顺序敏感性.Transformer模块:这里是transforem模块的编码器部分,根据base模式,12层,large模式24层.预微调模块:用来完成指定任务的输出.在经过上一层的输出.预微调模块.的几种微调任务:输入两个句子,判断两个句子关系(分类关系).输入一个句子进行分类.判断情感分类.输入一个问答对,在问题里面去找答案.阅读理解.输入一个句子进行token级别分类.

相关推荐
阿里云大数据AI技术29 分钟前
光轮智能 × 阿里云:共建 Physical AI 云上数据、评测与持续学习基础设施
人工智能·机器学习
机器之心34 分钟前
实锤了:Claude Code偷查用户,时区、中国AI实验室全是关键词
人工智能·openai
网易云信36 分钟前
Cursor点燃个人开发者,企业级AI为何频频受挫?Agent工厂从提效工具到AI员工的跃迁
人工智能·开源
网易云信39 分钟前
解锁触手可及的温暖:网易智企 x Wander Puffs AI 云游泡芙
人工智能
转转技术团队1 小时前
从 PRD 到可验证代码:AI 需求开发闭环实践
人工智能
机器之心1 小时前
飞书让表格变成「AI同事」加入群聊,不打开表就能用表
人工智能·openai
Bigfish_coding2 小时前
前端转agent-【python】-15 AI Agent 可观测性入门:LangFuse 链路追踪、Token 监控与 LLM 质量评估
人工智能
我唔知啊2 小时前
我把 Claude Code 拆成了一间餐厅:从一句话到一次回复,中间到底发生了什么
人工智能
Harry技术2 小时前
02 · Codex 核心概念:代理、沙箱、审批和项目说明书
人工智能