大模型技术

AI_小站16 天前
人工智能·深度学习·自然语言处理·langchain·大模型·transformer·大模型技术
基于Transformer架构的扩散模型本文介绍一篇发表于2023年国际计算机视觉大会(ICCV)的研究论文,该论文提出了一种基于Transformer架构的扩散模型,称为Diffusion Transformers (DiTs)。 通过用Transformer替代传统的U-Net架构,训练了一种作用于潜在图像块的扩散模型。 DiTs在大规模图像生成任务中展现出卓越的性能,成功实现了在ImageNet 256x256和512x512图像生成任务中的性能突破,表明了Transformer在扩散模型中的巨大潜力。
少喝冰美式17 天前
人工智能·pytorch·深度学习·语言模型·大模型·大语言模型·大模型技术
从零开始用Pytorch构建大型语言模型(LLM)生成式模型是目前人工智能领域最令人着迷的方向之一,尤其是那些基于用户提示生成文本的文本生成模型。一个著名的例子是 OpenAI 的 ChatGPT,它是一个 助手模型,可以回答用户在多个主题上的问题。
AI程序猿人2 个月前
数据库·人工智能·ai·大模型·facebook·模型微调·大模型技术
使用Facebook Messenger数据进行AI模型微调的完整指南在这个数字化时代,个性化的AI助手已经成为热门话题。而微调模型是实现这一目标的核心方法之一。本文将介绍如何从Facebook Messenger中提取对话数据,并使用这些数据对AI模型进行微调,从而创建更符合个人需求的AI助手。
AI程序猿人2 个月前
人工智能·大模型·word·embedding·计算机技术·大型语言模型·大模型技术
几种Word Embedding技术详解NLP 中的词嵌入是一个重要术语,用于以实值向量的形式表示用于文本分析的单词。这是 NLP 的一项进步,提高了计算机更好地理解基于文本的内容的能力。它被认为是深度学习在解决具有挑战性的自然语言处理问题方面最重要的突破之一。