语言模型

开放知识图谱4 小时前
人工智能·语言模型·自然语言处理·知识图谱
论文浅尝 | KnowGPT:利用知识图谱增强大型语言模型的专业领域问答能力(NeurIPS2024)笔记整理:庄祥,浙江大学博士生论文链接:https://openreview.net/pdf?id=PacBluO5m7
带电的小王17 小时前
人工智能·语言模型·prompt
【大模型基础_毛玉仁】3.5 Prompt相关应用Prompt工程应用广泛,能提升大语言模型处理基础及复杂任务的能力,在构建Agent、数据合成、Text-to-SQL转换和设计个性化GPTs等方面不可或缺。
Nicolas8931 天前
语言模型·大模型·多模态·视觉理解·cogvlm·visionllm·视觉语言预训练模型
【大模型理论篇】CogVLM:多模态预训练语言模型前两天我们在《Skywork R1V: Pioneering Multimodal Reasoning with Chain-of-Thought》中介绍了将ViT与推理模型结合构造多模态推理模型的案例,其中提到了VLM的应用。追溯起来就是两篇前期工作:Vision LLM以及CogVLM。
墨绿色的摆渡人1 天前
人工智能·pytorch·语言模型
用 pytorch 从零开始创建大语言模型(零):汇总本系列官方代码库:https://github.com/rasbt/LLMs-from-scratch/tree/main 官方书籍:Build a Large Language Model (From Scratch)
天天进步20151 天前
人工智能·语言模型·自然语言处理
用Ollama部署大语言模型大语言模型(Large Language Models,LLMs)正在彻底改变我们与技术的交互方式。从自动化内容创建到复杂问题解答,LLMs的应用范围广泛且不断扩展。然而,部署这些强大的模型通常需要专业知识和大量计算资源。Ollama的出现改变了这一现状,它为个人用户和开发者提供了一种简单方便的方式来在本地部署和运行大语言模型。
君的名字1 天前
论文阅读·人工智能·语言模型
【论文阅读】大型语言模型能否实现软件漏洞的检测与修复?这篇文章翻译自 CAN LARGE LANGUAGE MODELS FIND AND FIX VULNERABLE SOFTWARE? 大型语言模型能否实现软件漏洞的检测与修复?
大数据追光猿2 天前
数据库·人工智能·深度学习·语言模型·ai编程
【大模型面试知识】基础问题分析&总结持续更新。。。。。。。Decoder-Only 架构之所以成为主流大模型的选择,主要归因于以下几点:尽管 Encoder-Only 和 Encoder-Decoder 架构在某些特定任务中表现优异,但 Decoder-Only 架构凭借其简洁性和高效性,在大规模生成任务中占据了主导地位。
cv2016_DL2 天前
人工智能·机器学习·语言模型·自然语言处理·transformer
多模态大模型常见问题1.视觉编码器和 LLM 连接时,使用 BLIP2中 Q-Former那种复杂的 Adaptor 好还是 LLaVA中简单的 MLP 好,说说各自的优缺点?
可乐加.糖2 天前
java·语言模型·腾讯云·deepseek
腾讯云创建DeepSeek AI应用及使用教程在开始创建应用之前,请确保您已经完成了以下准备工作:注册腾讯云账户:如果还没有腾讯云账户,您需要首先注册一个腾讯云账户,并完成实名认证。可以前往腾讯云官网进行注册。
Loving_enjoy2 天前
语言模型
SEARCH-R1:大型语言模型的多轮搜索推理革命当AI学会"边搜索边思考" 2025年,语言模型领域迎来重大突破——SEARCH-R1框架通过强化学习(RL)让大模型实现"动态搜索+自主推理"的协同进化。这项技术不仅让模型在回答"泰坦尼克号沉没时的船长是谁"时能自动检索航海日志,还能在解决复杂数学题时边查公式边验证思路。本文将深度解析这场"搜索增强推理"的技术革命,揭示其如何突破传统RAG和工具调用范式的局限。
蜗牛沐雨2 天前
人工智能·语言模型·自然语言处理
RAG 技术:让大型语言模型更智能在当今数字化时代,大型语言模型(LLMs)已经成为人工智能领域的重要组成部分,广泛应用于各种自然语言处理任务中。为了进一步提升这些模型的性能和适应性,RAG(检索增强生成)技术应运而生。以下是对 RAG 技术的深入探讨:
张同学吧2 天前
语言模型·langchain
使用LangChain实现基于LLM和RAG的PDF问答系统本文将介绍 LLM 和 RAG 的基本概念,并通过一个实际的代码示例,展示如何使用 LangChain 构建一个基于 PDF 文档的问答系统。
练习两年半的工程师2 天前
人工智能·语言模型·机器人
利用大语言模型 Google Gemini API 制作一个AI聊天机器人这个 HTML 代码是一个 AI 聊天机器人网页前端界面,具有以下功能:这段代码实现了: ✅ AI 聊天交互 ✅ 打字机效果 ✅ 文件上传支持 ✅ 深色/浅色模式 ✅ 响应管理和错误处理
Jozky862 天前
人工智能·语言模型·自动驾驶
OpenEMMA: 基于多模态大语言模型的端到端开源自动驾驶框架OpenEMMA: 基于多模态大语言模型的端到端开源自动驾驶框架OpenEMMA 将前置摄像头图像和车辆历史文本状态作为输入。驾驶任务被构建为视觉问答(VQA)问题,利用思维链推理来指导模型生成关键物体的详细描述、行为洞察和元驾驶决策。这些决策由模型直接推断得出,为生成路径点提供了必要的上下文。为了减轻多模态大语言模型在目标检测任务中已知的局限性,OpenEMMA 集成了经过微调的 YOLO 版本,该版本针对自动驾驶场景中的 3D 边界框预测进行了专门优化,显著提高了检测精度。此外,通过利用多模态大语言模
寻丶幽风2 天前
论文阅读·人工智能·笔记·语言模型
论文阅读笔记——Adapter,AdapterFusion,AdapterDropAdapter 论文 Adapter 是一组轻量级的参数,被添加到模型的中间层,以保护原有预训练模型的参数。 Adapter:少量参数和近似恒等初始化。注意:仍然增加了网络深度!!! Adapter模块由两个前馈子层构成。第一个子层接收 Transformer 块的输出,并将原始输入维度 d 映射到较小的维度 m(通常m远小于d),以此限制模块的参数量。第二个子层则负责将维度m重新映射回d,作为模块的最终输出。这种设计使得 Adapter 模块能够在不调整整个模型参数的情况下,灵活适应新的下游任务,有效避
墨绿色的摆渡人3 天前
人工智能·pytorch·语言模型
用 pytorch 从零开始创建大语言模型(一):理解大型语言模型本章内容包括:大型语言模型(LLM)(如 OpenAI的ChatGPT)是近年来发展起来的深度神经网络模型,它们开启了自然语言处理(NLP) 的新纪元。
面包圈蘸可乐3 天前
人工智能·学习·语言模型
DNA语言模型GROVER学习人类基因组中的序列上下文原文标题:DNA language model GROVER learns sequence context in the human genome
modest —YBW3 天前
人工智能·语言模型
llamafactory的参数详解 1:(量化等级和方法 RoPE插值方法 加速方式),会对照图片解释,适合小白因为刚刚接触大模型,是新手小白,所以刚好学习一下参数是什么意思,在这里分享。定义: 量化等级是指将连续或高精度的数据(如浮点数)转换为离散或低精度表示(如整数)时所划分的“级别”数量。量化等级决定了数据的表示范围和精度。
IT从业者张某某3 天前
人工智能·语言模型·transformer·datawhale
大语言模型-2.1-Transformer架构及详细配置本博客内容是《大语言模型》一书的读书笔记,该书是中国人民大学高瓴人工智能学院赵鑫教授团队出品,覆盖大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助学员全面掌握大语言模型的核心技术。并且,课程内容基于大量的代码实战与讲解,通过实际项目与案例,学员能将理论知识应用于真实场景,提升解决实际问题的能力。