主要的有点就是快,用途就是用于文本分类,模型结构如上,主要是通过embedding将文本转换成向量,然后进行mean-pooling,然后输入到hidden隐向量中,通过softmax输出多分类,损失函数是对数似然损失函数(log-likelihood loss).
Bag of Tricks for Efficient Text Classification(FastText)
WitsMakeMen2023-10-22 13:48
相关推荐
请站在我身后2 小时前
复现Qwen-Audio 千问知来者逆6 小时前
Binoculars——分析证实大语言模型生成文本的检测和引用量按学科和国家明确显示了使用偏差的多样性和对内容类型的影响Kongues8 小时前
探究人工智能在教育领域的应用——以大语言模型为例小军军军军军军12 小时前
MLU运行Stable Diffusion WebUI Forge【flux】敲代码敲到头发茂密14 小时前
【大语言模型】LangChain 核心模块介绍(Memorys)西西弗Sisyphus1 天前
大型语言模型(LLMs)演化树 Large Language Modelsweixin_443290691 天前
【阅读记录-章节6】Build a Large Language Model (From Scratch)地中海~1 天前
Stealthy Attack on Large Language Model based Recommendation西西弗Sisyphus1 天前
探索多模态大语言模型(MLLMs)的推理能力三月七(爱看动漫的程序员)1 天前
HiQA: A Hierarchical Contextual Augmentation RAG for Multi-Documents QA---附录