语言模型

学历真的很重要

Eino 开源框架全景解析 - 以“大模型应用的搭积木指南”方式理解（一）Eino 是字节跳动开源的大语言模型应用开发框架，就像是一个专门为 AI 应用设计的"搭积木工具箱"，让开发者能够像搭乐高一样轻松构建复杂的 AI 应用。

简单聊聊多模态大语言模型MLLM本文是笔者阅读相关文章后，按个人理解的总结。如有不正之处，欢迎指正！https://zhuanlan.zhihu.com/p/674698482

泡泡茶壶_ovo

RORPCAP: retrieval-based objects and relations prompt for image captioning研究方向：Image Captioning本文提出了一种基于检索的对象与关系提示用于图片标题生成（RORPCap），以最短的训练时间达到了与基于检测器与图卷积网络（GCN）的模型相当的性能指标。

凉冰不加冰

大语言模型原理（Transformer架构）大语言模型（LLM）是基于深度学习和神经网络的自然语言处理技术，目前主要通过Transformer架构和大规模数据训练来理解和生成语言。

详细分析大语言模型attention的计算复杂度，从数学角度分析下面以**单层多头自注意力（Multi-Head Self-Attention, MHA）**为基准，分别给出时间/空间复杂度、精确到常数的 FLOPs 估算、训练与推理（含 KV Cache）阶段的差异，以及若干改进/近似注意力的复杂度对比与直觉化解释。

勤劳的进取家

论文阅读：Do As I Can, Not As I Say: Grounding Language in Robotic Affordances地址：Do As I Can, Not As I Say: Grounding Language in Robotic Affordances

大模型0基础开发入门与实践：第8章 “大力出奇迹”的哲学：大语言模型的核心技术揭秘在过去的几章里，我们精心研究了如何设计一个更聪明的“大脑”（神经网络架构），如何让它高效地学习（训练范式）。现在，我们面临一个简单而又深刻的问题：如果想让这个“大脑”变得更聪明，最有效的方法是什么？

自然语言处理NLP L4: 高级语言模型——四种泛化平滑方式L4 Advance Language Models高级语言模型记住一个语言模型，无论是 n-gram 语言模型，还是神经语言模型。最终，它是一个将概率与序列相关联的模型。最常见的方法是使用这个最大似然估计（Maximum Likelihood Estimate, MLE）

检索增强生成(RAG) 缓存增强生成(CAG) 生成中检索(RICHES) 知识库增强语言模型(KBLAM)以下是当前主流的四大知识增强技术方案对比，涵盖核心原理、适用场景及最新发展趋势，为开发者提供清晰的技术选型参考：

在MAC环境中安装unsloth我的电脑是MAC, 跟着教程安装 unsloth 一直报错.看报错信息说没有 ‘numpy’ 模块, 网上资料说是 ‘numpy’ 版本不兼容。

LLM（大语言模型）的工作原理图文讲解目录1. 条件概率：上下文预测的基础2. LLM 是如何“看着上下文写出下一个词”的？补充说明（重要）

uv与conda的区别及选择指南uv 和 conda 都是 Python 的包管理和环境管理工具，但它们在设计理念、性能和使用场景上有显著区别。以下是它们的核心对比：

Transformer中的编码器和解码器是什么？今天，我们来具体介绍Transformer的架构设计。一个完整的Transformer模型就像一个高效的语言处理工厂，主要由两大车间组成：编码车间和解码车间。

大模型微调RAG、LORA、强化学习大模型微调是指在已经预训练好的大型语言模型基础上，使用特定的数据集进行进一步的训练，以使模型适应特定任务或领域。

Infusing fine-grained visual knowledge to Vision-Language ModelsAuthors: Nikolaos-Antonios Ypsilantis, Kaifeng Chen, André Araujo, Ondřej Chum

在相机空间中落地动作：以观察为中心的视觉-语言-行动策略25年8月来自浙大、上海AI实验室、商汤、南京大学和清华的论文“Grounding Actions in Camera Space: Observation-Centric Vision-Language-Action Policy”。

Tello无人机与LLM模型控制 ROS这个项目是我们开出来的一个项目，用 LLM+tools 的方式控制 DJI Tello 无人机运动，由于是已经开源出来的项目，因此建议直接跳转至我们的项目链接，所有的更新与 Bug 修复都会第一时间同步上去，博客的更新可能存在滞后。

什么都想学的阿超

【大语言模型 00】导读关键词：大语言模型、LLM、Transformer、深度学习、AI工程化、全栈开发、技术路线图摘要：这是一份完整的大语言模型学习指南，涵盖从数学基础到商业落地的200篇深度文章。无论你是AI初学者还是资深工程师，都能在这里找到系统性的知识体系和实战经验。本导读将带你了解整个专栏的架构设计、学习路径和核心价值。

【OpenAI】 GPT-4o-realtime-preview 多模态、实时交互模型介绍+API的使用教程！GPT-4o-realtime-preview是OpenAI GPT-4系列的升级版，主打多模态全能性和实时交互能力。它不仅能处理文本，还支持音频、图像、视频四种模态的混合输入输出，且响应速度快到令人惊讶。

小白杨树树

【LLM】文献阅读-ISOLATE GPT：基于大语言模型的执行隔离架构原文链接：[2403.04960] IsolateGPT: An Execution Isolation Architecture for LLM-Based Agentic Systems