语言模型

学历真的很重要13 小时前
后端·语言模型·面试·golang·ai编程·eino
Eino 开源框架全景解析 - 以“大模型应用的搭积木指南”方式理解(一)Eino 是字节跳动开源的大语言模型应用开发框架,就像是一个专门为 AI 应用设计的"搭积木工具箱",让开发者能够像搭乐高一样轻松构建复杂的 AI 应用。
%KT%14 小时前
人工智能·语言模型·自然语言处理
简单聊聊多模态大语言模型MLLM本文是笔者阅读相关文章后,按个人理解的总结。如有不正之处,欢迎指正!https://zhuanlan.zhihu.com/p/674698482
泡泡茶壶_ovo14 小时前
人工智能·深度学习·计算机视觉·语言模型·prompt·多模态·imagecaptioning
RORPCAP: retrieval-based objects and relations prompt for image captioning研究方向:Image Captioning本文提出了一种基于检索的对象与关系提示用于图片标题生成(RORPCap),以最短的训练时间达到了与基于检测器与图卷积网络(GCN)的模型相当的性能指标。
凉冰不加冰16 小时前
语言模型
大语言模型原理(Transformer架构)大语言模型(LLM)是基于深度学习和神经网络的自然语言处理技术,目前主要通过Transformer架构和大规模数据训练来理解和生成语言。
Lntano__y17 小时前
人工智能·语言模型·自然语言处理
详细分析大语言模型attention的计算复杂度,从数学角度分析下面以**单层多头自注意力(Multi-Head Self-Attention, MHA)**为基准,分别给出时间/空间复杂度、精确到常数的 FLOPs 估算、训练与推理(含 KV Cache)阶段的差异,以及若干改进/近似注意力的复杂度对比与直觉化解释。
勤劳的进取家20 小时前
论文阅读·人工智能·机器学习·语言模型·自然语言处理
论文阅读:Do As I Can, Not As I Say: Grounding Language in Robotic Affordances地址:Do As I Can, Not As I Say: Grounding Language in Robotic Affordances
THMAIL20 小时前
人工智能·语言模型·自然语言处理
大模型0基础开发入门与实践:第8章 “大力出奇迹”的哲学:大语言模型的核心技术揭秘在过去的几章里,我们精心研究了如何设计一个更聪明的“大脑”(神经网络架构),如何让它高效地学习(训练范式)。现在,我们面临一个简单而又深刻的问题:如果想让这个“大脑”变得更聪明,最有效的方法是什么?
Fine姐2 天前
人工智能·语言模型·自然语言处理
自然语言处理NLP L4: 高级语言模型——四种泛化平滑方式L4 Advance Language Models高级语言模型记住一个语言模型,无论是 n-gram 语言模型,还是神经语言模型。 最终,它是一个将概率与序列相关联的模型。最常见的方法是使用这个最大似然估计(Maximum Likelihood Estimate, MLE)
天涯海风2 天前
人工智能·缓存·语言模型
检索增强生成(RAG) 缓存增强生成(CAG) 生成中检索(RICHES) 知识库增强语言模型(KBLAM)以下是当前主流的四大知识增强技术方案对比,涵盖核心原理、适用场景及最新发展趋势,为开发者提供清晰的技术选型参考:
铁锚3 天前
人工智能·python·macos·语言模型
在MAC环境中安装unsloth我的电脑是MAC, 跟着教程安装 unsloth 一直报错.看报错信息说没有 ‘numpy’ 模块, 网上资料说是 ‘numpy’ 版本不兼容。
It_张3 天前
人工智能·语言模型·自然语言处理
LLM(大语言模型)的工作原理 图文讲解目录1. 条件概率:上下文预测的基础2. LLM 是如何“看着上下文写出下一个词”的?补充说明(重要)
runfarther3 天前
语言模型·conda·ai编程·uv
uv与conda的区别及选择指南uv 和 conda 都是 Python 的包管理和环境管理工具,但它们在设计理念、性能和使用场景上有显著区别。以下是它们的核心对比:
AIGC安琪4 天前
人工智能·深度学习·ai·语言模型·大模型·transformer·ai大模型
Transformer中的编码器和解码器是什么?今天,我们来具体介绍Transformer的架构设计。一个完整的Transformer模型就像一个高效的语言处理工厂,主要由两大车间组成:编码车间和解码车间。
renhongxia14 天前
人工智能·深度学习·算法·语言模型
大模型微调RAG、LORA、强化学习大模型微调是指在已经预训练好的大型语言模型基础上,使用特定的数据集进行进一步的训练,以使模型适应特定任务或领域。
m0_603888714 天前
人工智能·ai·语言模型·自然语言处理·论文速览
Infusing fine-grained visual knowledge to Vision-Language ModelsAuthors: Nikolaos-Antonios Ypsilantis, Kaifeng Chen, André Araujo, Ondřej Chum
硅谷秋水4 天前
机器学习·计算机视觉·语言模型·机器人
在相机空间中落地动作:以观察为中心的视觉-语言-行动策略25年8月来自浙大、上海AI实验室、商汤、南京大学和清华的论文“Grounding Actions in Camera Space: Observation-Centric Vision-Language-Action Policy”。
nenchoumi31195 天前
人工智能·语言模型·机器人·无人机
Tello无人机与LLM模型控制 ROS这个项目是我们开出来的一个项目,用 LLM+tools 的方式控制 DJI Tello 无人机运动,由于是已经开源出来的项目,因此建议直接跳转至我们的项目链接,所有的更新与 Bug 修复都会第一时间同步上去,博客的更新可能存在滞后。
什么都想学的阿超5 天前
人工智能·语言模型·自然语言处理
【大语言模型 00】导读关键词:大语言模型、LLM、Transformer、深度学习、AI工程化、全栈开发、技术路线图摘要:这是一份完整的大语言模型学习指南,涵盖从数学基础到商业落地的200篇深度文章。无论你是AI初学者还是资深工程师,都能在这里找到系统性的知识体系和实战经验。本导读将带你了解整个专栏的架构设计、学习路径和核心价值。
z千鑫5 天前
人工智能·gpt·语言模型·aigc
【OpenAI】 GPT-4o-realtime-preview 多模态、实时交互模型介绍+API的使用教程!GPT-4o-realtime-preview是OpenAI GPT-4系列的升级版,主打多模态全能性和实时交互能力。它不仅能处理文本,还支持音频、图像、视频四种模态的混合输入输出,且响应速度快到令人惊讶。
小白杨树树5 天前
人工智能·gpt·语言模型
【LLM】文献阅读-ISOLATE GPT:基于大语言模型的执行隔离架构原文链接:[2403.04960] IsolateGPT: An Execution Isolation Architecture for LLM-Based Agentic Systems