技术栈
bert
毕竟是shy哥
20 小时前
人工智能
·
学习
·
bert
·
transformer
基于提示引导适配器的实体级对齐遥感图文检索
遥感图文检索(RSITR)是遥感领域的基础研究任务,近些年相关技术取得了长足发展。但现有算法大多缺少对遥感场景内语义实体的针对性关注,制约了模型的细粒度语义建模与跨模态匹配能力,最终造成检索效果不佳。针对上述短板,本文提出一种基于提示引导适配器的实体层级对齐框架(EAPA),通过显式完成遥感图文语义实体的特征感知、表征嵌入与跨模态对齐,提升检索性能。 该框架以CLIP(对比语言-图像预训练模型)为骨干网络,包含三大核心模块:提示引导注意力适配器(PAA)、伪标签监督实体嵌入模块(PEE)以及跨模态实体语义
happyprince
2 天前
人工智能
·
深度学习
·
bert
17-Hugging Face Transformers之BERT 案例详解:Transformers 框架全模块串联
本文档以 BERT 模型为例,将 Transformers 框架的所有模块串联起来,展示从加载到推理的完整生命周期。 所有引用均基于真实源码文件。
中科院提名者
4 天前
人工智能
·
深度学习
·
bert
BERT 模型的运行机制及DistilBERT 的蒸馏压缩过程
BERT(Bidirectional Encoder Representations from Transformers)的核心突破在于其真正的双向上下文表示能力。它完全抛弃了传统的 RNN/LSTM 架构,采用了纯 Transformer 的编码器(Encoder)堆叠。
z小猫不吃鱼
6 天前
深度学习
·
bert
·
transformer
05 Transformer Encoder 详解:BERT 为什么使用 Encoder?
在前面的文章中,我们已经讲过 Transformer 的整体结构、Self-Attention 的计算过程,以及 GPT 为什么选择 Transformer Decoder。我们知道,原始 Transformer 由 Encoder 和 Decoder 两部分组成:
kcuwu.
6 天前
人工智能
·
分类
·
bert
BERT文本分类完整实战指南
BERT(Bidirectional Encoder Representations from Transformers)作为自然语言处理领域的里程碑模型,自 2018 年提出以来,已成为各类 NLP 任务的标配基础模型。本文将基于完整的工业级代码实现,深入剖析 BERT 文本分类任务的每一个技术细节,从配置管理、数据处理、模型构建、训练流程到模型评估,带你系统性掌握 BERT 分类任务的完整实现。
毕竟是shy哥
7 天前
人工智能
·
bert
·
transformer
BERT:基于深度双向 Transformer 的语言理解预训练模型
BERT 是 Google 提出的深度双向预训练语言模型,仅用 Transformer 编码器,通过双向上下文联合建模打破传统单向 / 浅双向模型限制,开创 NLP 预训练 + 微调通用范式。
独孤--蝴蝶
9 天前
人工智能
·
深度学习
·
bert
BERT在开发中的一些方法的应用以及讲解
使用BERT训练分类任务的时候输入文本: "今天天气很好"|input_ids = [101, 791, 211, 369, 361, 2521, 1962, 102]
z小猫不吃鱼
10 天前
学习
·
bert
·
transformer
08 BERT 论文精读:双向 Transformer 如何学习语言表示?
在上一篇文章中,我们精读了 GPT-1。GPT-1 的核心思想是:先使用 Transformer Decoder 在大规模无标注文本上进行生成式预训练,然后再把预训练模型迁移到下游 NLP 任务中进行微调。它走的是 从左到右的自回归语言模型路线。
十年一梦惊觉醒
11 天前
人工智能
·
深度学习
·
bert
BERT模型应用智能客服方案
方案旨在解决企业自有业务场景下,且设备预算有限的小成本智能客服方案。bert模型可运行在仅CPU设备环境,且相应速度迅速,可实现企业级智能体的搭建需求。同时结合freeswitch语音识别,即可完成呼叫中心智能客服功能,freeswitch语音识别可参照往期文章,有业务需求可邮箱mokeily99@126.com或主页咨询
code_pgf
11 天前
人工智能
·
gpt-3
·
bert
BERT 与 GPT-3 模型结构及语言理解/生成能力对比
BERT 的核心定位是“读懂文本”:采用双向 Transformer Encoder,通过同时查看目标词左右两侧上下文,学习适合分类、匹配、信息抽取和阅读理解的语义表示。
Lyn_Li
14 天前
nlp
·
bert
·
词向量
·
sif
·
句子向量
给句子做个“语义审计”:从词向量到句子向量的方法论
上一篇从独热向量到词向量:彻底搞懂 AI 如何理解语言我们理解了:词向量是给每个词拍一张“证件照”。但现实中的任务,往往是处理一整句话。一句话里有一叠“证件照”,怎么看出这句话到底代表什么?这就是本文要解决的问题。 这篇笔记不是冰冷的技术罗列,而是一次用审计思维对“语义融合”进行的阐述,本文将像分析公司一样分析句子,看看如何将词向量合并,得到代表整句话的句子向量。
z小猫不吃鱼
16 天前
人工智能
·
深度学习
·
bert
15 BEiT 论文精读:BERT Pre-Training of Image Transformers
在上一篇文章中,我们精读了 MAE。MAE 的核心思想非常直接:把图像中的大部分 patch 遮住,只让编码器看到少量可见 patch,然后通过解码器重建被遮住区域的像素。从直觉上看,MAE 更像是一个“图像补全任务”:模型需要根据可见部分推测缺失区域长什么样。
Hali_Botebie
20 天前
人工智能
·
深度学习
·
bert
【蒸馏】Tinybert:Distilling BERT for natural language understanding.
我们首先提出了一种新颖的 Transformer 蒸馏方法,该方法专为基于 Transformer 模型的知識蒸馏(Knowledge Distillation, KD)而设计。借助这一新的 KD 方法,大型“教师”BERT 中编码的大量知识可以有效地迁移到小型“学生”TinyBERT 中。随后,我们引入了一种新的两阶段学习框架,用于 TinyBERT,该框架在预训练阶段和特定任务学习阶段均执行 Transformer 蒸馏。该框架确保了 TinyBERT 能够捕获 BERT 中通用领域知识以及特定任务知
Hali_Botebie
20 天前
人工智能
·
深度学习
·
bert
【量化】Q-bert: Hessian based ultra low precision quantization of bert.
在本工作中,我们利用二阶海森矩阵信息进行详尽的细调 BERT 模型分析,并基于分析结果提出了一种将 BERT 模型量化至超低精度的新方法。具体而言,我们提出了一种新的分组量化方案,并采用基于海森矩阵的混合精度方法进一步压缩模型。
Hali_Botebie
20 天前
人工智能
·
深度学习
·
bert
【量化】I-BERT: Integer-only BERT Quantization
在这项工作中,我们提出了 I-BERT,这是一种面向基于 Transformer 的模型的新型量化方案,其整个推理过程均仅采用整数运算。依托于针对非线性操作(如 GELU、Softmax 和 Layer Normalization)的轻量级纯整数近似方法,I-BERT 能够实现端到端的纯整数 BERT 推理,无需任何浮点计算。
沪漂阿龙
25 天前
人工智能
·
神经网络
·
自然语言处理
·
bert
·
word2vec
面试题:文本表示方法详解——One-hot、Word2Vec、上下文表示、BERT词向量全解析(NLP基础高频考点)
1. 为什么面试官总爱问“文本表示方法”?1.1 这个问题的本质是什么任何 NLP 系统,不管是情感分析、文本分类、搜索推荐、智能客服,还是今天的大模型应用,本质上都绕不开一个前提:机器并不真正认识“文字”,它最终只能处理数字。所以,所谓“文本表示方法”,就是把人类语言转成机器可以计算的数值形式。
小何code
25 天前
自然语言处理
·
bert
·
transformer
·
预训练模型
人工智能【第24篇】BERT模型详解:预训练语言模型的里程碑
作者的话:在前面的文章中,我们学习了Transformer架构。2018年,Google发布了BERT(Bidirectional Encoder Representations from Transformers),开启了预训练语言模型的新时代。BERT通过双向编码器和创新的预训练任务,在多项NLP任务上取得了突破性进展。本文将深入讲解BERT的原理、预训练、微调和应用,帮助你理解这一里程碑式的模型!
小何code
1 个月前
深度学习
·
bert
·
transformer
·
注意力机制
人工智能【第23篇】Transformer模型详解:Attention Is All You Need
作者的话:在前面的文章中,我们学习了Seq2Seq和注意力机制。2017年,Google的论文《Attention Is All You Need》彻底改变了NLP领域,提出了Transformer架构。Transformer完全基于注意力机制,摒弃了RNN的循环结构,实现了并行计算和更强的长距离依赖建模能力。本文将深入讲解Transformer的原理和实现,带你理解现代大语言模型的基础!
輕華
1 个月前
深度学习
·
bert
·
transformer
Transformer架构深度解析——从Attention到BERT的基石
标签:深度学习 · NLP · Transformer · Self-Attention · BERT · 位置编码 摘要:本文以程序员视角,从传统序列模型的痛点出发,逐层拆解 Transformer 的核心组件——Self-Attention、Multi-Head Attention、位置编码、残差连接与归一化,最终梳理 Encoder-Decoder 的完整数据流。这是理解 BERT、GPT 等现代预训练语言模型的必备基础。
Westward-sun.
1 个月前
人工智能
·
bert
·
transformer
BERT 模型深度解析:从 Transformer Encoder 到预训练语言理解模型
BERT 是自然语言处理领域具有里程碑意义的预训练语言模型。它的全称是 Bidirectional Encoder Representations from Transformers,即“来自 Transformer 的双向编码器表示”。BERT 的核心思想是:先在大规模无标注文本上进行预训练,学习通用语言表示,再将预训练模型迁移到文本分类、命名实体识别、问答系统、文本匹配等下游任务中进行微调。