计算机技术

AI_小站15 天前
人工智能·深度学习·大模型·llm·transformer·大语言模型·计算机技术
实践教程|Transformer Decoder-Only 模型批量生成 Trick导读本文给出了一个用单Transformer decoder( GPT)模型进行批量生成时的解决方法。
爱喝白开水a1 个月前
图像处理·人工智能·深度学习·transformer·预训练·ai大模型·计算机技术
基于Transformer的图像处理预训练模型本文介绍一篇发表在CVPR 2021上的文章,该文章提出了一种基于Transformer的图像处理预训练模型,可以在较小的数据集上进行微调后,直接应用到具体的图像处理任务(如去噪,超分,去雨等)。
python_知世1 个月前
人工智能·自然语言处理·金融·llm·计算机技术·大模型微调·大模型研究报告
2024年中国金融大模型产业发展洞察报告(附完整PDF下载)本报告从金融大模型的技术发展背景入手,详细介绍了大模型的结构特征、优势能力,并结合行业卓越者的评选结果,展现了行业内的领先企业和他们的成功案例。报告进一步探讨了金融大模型产业的未来趋势,包括市场趋势前瞻、产品结构建设、技术能力迭代以及未来场景应用,为行业参与者提供战略决策的参考。此外,报告还收录了行业专家的见解,为读者带来第一手的行业洞察。整体而言,本报告是理解中国金融大模型产业发展不可多得的资料,适合金融科技领域的决策者、从业者及投资者阅读。
HyperAI超神经1 个月前
人工智能·深度学习·自然语言处理·tvm·计算机技术·编程开发·编译框架
【TVM 教程】使用 Tensorize 来利用硬件内联函数Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 → https://tvm.hyper.ai/
少喝冰美式1 个月前
人工智能·程序人生·自然语言处理·大模型·大语言模型·计算机技术·大模型应用
大语言模型在序列推荐中的应用序列推荐技术通过分析用户的过往交互历史,能够有效挖掘出用户可能感兴趣的项目,对于提升各类应用的服务质量具有重要作用。近期,大语言模型(LLMs)的发展在应对复杂的推荐问题上展现出了显著的优势。不过,这种方法也面临一些挑战。本篇文章将重点探讨两项将大语言模型应用于序列推荐领域的相关研究。
python_知世2 个月前
人工智能·深度学习·程序人生·自然语言处理·产品经理·计算机技术·大模型应用
AI时代:成为产品经理的核心路径今天我们来看看成为AI产品经理的几个阶段。首先看入行前的心理认知。笔者建议读者不要盲目崇拜AI,同时也绝不能因为迷茫而轻视AI。比如,很多人认为AI很快就要改变我们的生活,在不久的将来我们将不再需要人工驾驶汽车,汽车可以自动驾驶,因此可以不学车了;很多人还认为在不久的将来也许不需要上网去社交,因为出现了AI生成的男女朋友。笔者觉得要实现以上两个场景至少还需要15年以上的时间。
我爱学Python!2 个月前
人工智能·程序人生·语言模型·自然语言处理·llm·大语言模型·计算机技术
大语言模型(LLM)快速理解自2022年,ChatGPT发布之后,大语言模型(Large Language Model),简称LLM掀起了一波狂潮。作为学习理解LLM的开始,先来整体理解一下大语言模型。
我爱学Python!2 个月前
人工智能·语言模型·自然语言处理·大模型·llm·大语言模型·计算机技术
Ovis: 多模态大语言模型的结构化嵌入对齐论文题目: Ovis: Structural Embedding Alignment for Multimodal Large Language Model
python_知世2 个月前
人工智能·大模型·llm·大语言模型·产品经理·计算机技术·转行产品经理
转行AI产品经理,第二步怎么走之前写了一篇文章《转行AI产品经理,第一步怎么走》,好多小伙伴私信我,和我聊了一些细节,我感觉有必要再聊一聊,转行AI产品经理,第二步怎么走。
AI_小站2 个月前
人工智能·pytorch·深度学习·大模型·transformer·计算机技术·大模型应用
三种Transformer模型中的注意力机制介绍及Pytorch实现:从自注意力到因果自注意力本文深入探讨Transformer模型中三种关键的注意力机制:自注意力、交叉注意力和因果自注意力。这些机制是GPT-4、Llama等大型语言模型(LLMs)的核心组件。通过理解这些注意力机制,我们可以更好地把握这些模型的工作原理和应用潜力。
AI程序猿人2 个月前
人工智能·大模型·word·embedding·计算机技术·大型语言模型·大模型技术
几种Word Embedding技术详解NLP 中的词嵌入是一个重要术语,用于以实值向量的形式表示用于文本分析的单词。这是 NLP 的一项进步,提高了计算机更好地理解基于文本的内容的能力。它被认为是深度学习在解决具有挑战性的自然语言处理问题方面最重要的突破之一。
AI大模型_学习君2 个月前
人工智能·深度学习·机器学习·pdf·llm·ai大模型·计算机技术
实验 | 使用本地大模型从论文PDF中提取结构化信息非结构文本、图片、视频等数据是待挖掘的数据矿藏, 在经管、社科等研究领域中谁拥有了_从非结构提取结构化信息的能力_,谁就拥有科研上的数据优势。正则表达式是一种强大的文档解析工具,但它们常常难以应对现实世界文档的复杂性和多变性。而随着chatGPT这类LLM的出现,为我们提供了更强大、更灵活的方法来处理多种类型的文档结构和内容类型。
爱喝白开水a3 个月前
人工智能·深度学习·llm·大语言模型·ai大模型·计算机技术·本地部署大模型
关于大模型在企业生产环境中的独立部署问题最近一段时间公司在搞AIGC领域的产品,虽然集成了很多第三方的大模型服务接口,但从节省成本的角度,公司也找了一部分具有相似效果的开源模型做独立部署。
少喝冰美式3 个月前
人工智能·深度学习·llm·transformer·大语言模型·ai大模型·计算机技术
深度学习 Transformer 的标签平滑(Label Smoothing)01引言标签平滑(Label Smoothing)是一种正则化技术,用于深度学习中的分类任务,尤其是在Transformer模型中。它的目的是减少模型对于训练数据中硬标签(hard labels,即标准的one-hot编码)的过度自信,从而提高模型的泛化能力并减少过拟合。
我爱学Python!3 个月前
人工智能·ai·llm·github·大语言模型·计算机技术·大模型应用
每日 GitHub 探索|构建强大 LLM 管道和优化 AI 聊天框架探索 DSPy,一款用于优化 LLM 提示和权重的框架。了解 Anthropic Cookbook,该代码库提供使用 Anthropic 强大 AI 模型的可复制代码片段。此外,还有 LobeChat,一个开源、现代设计的 AI 聊天框架,支持多种 AI 供应商和功能。
少喝冰美式3 个月前
人工智能·华为·面试·职场和发展·ai大模型·计算机技术·大模型面试
一场大模型面试,三个小时,被撞飞了去华为面试大模型,一点半去五点半回,已经毫无力气。1️⃣一轮面试—1小时 因为一面都是各个业务的主管,所以专业性很强,面试官经验很丰富,建议大家还是需要十分熟悉所学内容,我勉强通过一面。
AI大模型_学习君3 个月前
人工智能·深度学习·算法·bert·ai大模型·计算机技术·大模型应用
快速学会一个算法,BERT今天给大家介绍一个强大的算法模型,BERTBERT(Bidirectional Encoder Representations from Transformers)是一种基于 Transformer 架构的深度学习模型,主要用于处理自然语言处理(NLP)问题。
少喝冰美式3 个月前
人工智能·spring boot·后端·langchain·llm·ai大模型·计算机技术
【大模型教程】如何在Spring Boot中无缝集成LangChain4j,玩转AI大模型!LangChain4j 提供了用于以下功能的 Spring Boot 启动器:Spring Boot 启动器帮助通过属性创建和配置 语言模型、嵌入模型、嵌入存储 和其他核心 LangChain4j 组件。
AI_小站3 个月前
大语言模型·ai大模型·计算机技术·大模型训练·视觉大模型·ollama·大模型应用
值得细读的8个视觉大模型生成式预训练方法大语言模型的进展催生出了ChatGPT这样的应用,让大家对“第四次工业革命”和“AGI”的来临有了一些期待,也作为部分原因共同造就了美股2023年的繁荣。LLM和视觉的结合也越来越多:比如把LLM作为一种通用的接口,把视觉特征序列作为文本序列的PrefixToken,一起作为LLM的输入,得到图片或者视频的caption;也有把LLM和图片生成模型、视频生成模型结合的工作,以更好控制生成的内容。当然2023年比较热门的一个领域便是多模态大模型,比如BLIP系列、LLaVA系列、LLaMA-Adapter系