大语言模型

LLaVA-3D，Video-3D LLM，VG-LLM，SPAR论文解读目录一、LLaVA-3D1、概述2、方法3、训练过程4、实验二、Video-3D LLM1、概述2、方法

SpatialVLM和SpatialRGPT论文解读目录一、SpatialVLM1、概述2、方法3、实验二、SpatialRGPT1、概述2、方法3、训练方法

努力还债的学术吗喽

2020 GPT3 原文 Language Models are Few-Shot Learners 精选注解本文为个人阅读GPT3，部分内容注解，由于GPT3原文篇幅较长，且GPT3无有效开源信息这里就不再一一粘贴，仅对原文部分内容做注解，仅供参考详情参考原文链接原文链接：https://arxiv.org/pdf/2005.14165

HyperAI超神经

【vLLM 学习】Load Sharded StatevLLM 是一款专为大语言模型推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。

Nature论文-预测和捕捉人类认知的基础模型-用大模型模拟人类认知原文地址建立一个统一的认知理论一直是心理学的一个重要目标。建立这种理论的第一步是建立一个计算模型，可以预测人类在各种环境中的行为。在这里，我们介绍了Centaur，一个计算模型，可以预测和模拟人类的行为在任何实验表达的自然语言。我们通过在名为Psych-101的大规模数据集上微调最先进的语言模型来获得Centaur。Psych-101具有前所未有的规模，涵盖了超过60，000名参与者在160个实验中进行超过10，000，000次选择的试验数据。Centaur不仅比现有的认知模型更好地捕捉了被拒参与者的行为

基于进化算法的假新闻检测优化框架（FDOF）这篇论文提出了一种名为基于进化算法的假新闻检测优化框架（FDOF），旨在通过优化提示（prompt）来提升大型语言模型（LLM）在假新闻检测任务中的性能和可解释性。

“大模型”技术专栏 | 和鲸 AI Infra 架构总监朱天琦：大模型微调与蒸馏技术的全景分析与实践指南（上）编者按：人工智能正以前所未有的渗透力重塑生产与生活图景。作为国内领先的数据智能科技企业，和鲸科技自 2015 年成立以来，深耕人工智能与数据科学，历经十年发展，已在气象、教育、医疗、航空航天、金融、通信、能源、零售等领域，与众多高校、科研机构、企业等单位展开了深度合作。

生成式人工智能展望报告-欧盟-04-社会影响与挑战原文地址本章探讨了GenAI的社会影响，强调了技能差距以及公民和劳动力对AI素养的需求。它讨论了数字公共领域和人工智能与环境问题的交叉点，以及媒体中的Gen AI及其发展的整体感知，公共话语和叙事。本章还讨论了人工智能系统中的儿童权利和性别偏见问题，以及产生虚假或误导性内容的可能性。GenAI政策分析的行为方法被提出作为应对隐私和数据保护挑战的一种手段。本章提出了一些关键问题，即如何确保包容性和道德的人工智能应用符合社会价值观。

自适应集群协作提升大语言模型医疗决策支持能力大语言模型（LLMs）的协作能力在自然语言处理系统中已被证明有效，对医疗健康领域发展具有重要潜力。然而，现有方法缺乏明确的组件选择规则，需依赖人工干预或临床特定验证。此外，当前架构严重依赖预定义的LLM集群，其中部分模型在医疗决策支持场景中表现不佳，导致协作失效。为此，提出一种自适应集群协作方法，结合自多样性和跨一致性最大化机制：

想去的远方

OpenAI Python API 完全指南：从入门到实战OpenAI Python API 库为开发者提供了便捷访问 OpenAI 强大 AI 模型的能力。本文将详细介绍该库的各项功能，并通过代码示例展示如何使用。

AI代理性能提升实战：LangChain+LangGraph内存管理与上下文优化完整指南在AI代理系统的开发过程中，上下文工程已成为决定系统性能的关键技术。上下文工程本质上是在为AI系统分配任务之前建立合适的执行环境，这个环境需要包含明确的行为指令（如配置AI充当专业的预算旅行顾问）、来自数据库、文档或实时数据源的有用信息访问权限、对历史对话的记忆能力以避免信息重复或遗忘、可供AI调用的工具集（计算器、搜索引擎等功能组件），以及用户的个性化信息（偏好设置、地理位置等关键细节）。

从零搭建智能搜索代理：LangGraph + 实时搜索 + PDF导出完整项目实战传统的AI聊天系统往往局限于预训练数据的知识范围，无法获取实时信息。本文将详细阐述如何构建一个基于LangGraph的智能代理系统，该系统能够智能判断何时需要进行网络搜索、有效维护对话上下文，并具备将对话内容导出为PDF文档的功能。

【人工智能】通过 Dify 构建智能助手智能助手（Agent Assistant），利用大语言模型的推理能力，能够自主对复杂的人类任务进行目标规划、任务拆解、工具调用、过程迭代，并在没有人类干预的情况下完成任务。

【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析ChatGPT（由 OpenAI 开发）和 DeepSeek（由深度求索公司开发）都是基于大语言模型（LLM，Large Language Model）的技术，但它们在模型架构、训练数据、优化目标和具体应用上存在差异。

L0：让大模型成为通用智能体的强化学习新范式在AI智能体研究领域，如何让大语言模型高效完成多轮、长周期任务仍是难题。本文将解读论文L0，其提出的端到端训练 pipeline 与 NB-Agent 架构，通过强化学习显著提升模型在问答任务上的表现，为通用智能体发展提供新思路。

在未来等你

RAG实战指南 Day 4：LlamaIndex框架实战指南RAG,LlamaIndex,检索增强生成,大语言模型,AI开发本文是"RAG实战指南"系列的第4天，聚焦LlamaIndex框架的核心功能与实战应用。我们将深入解析LlamaIndex在RAG系统中的定位，详细讲解其数据连接器、索引构建和查询引擎三大核心组件的工作原理。文章包含完整的Python代码实现，展示如何从零构建一个基于LlamaIndex的文档问答系统，涵盖文档加载、索引创建、向量检索和响应生成全流程。通过与传统方法的对比分析，我们将揭示LlamaIndex在结构化数据处理和多源集成方面的独特

小白跃升坊

【干货分享】手把手教你实现AI应用对话批量自动化测试（含源码）MaxKB对话应用在发布之后，可以使用本文提供的Python自动化测试脚本，快速验证对话应用的响应结果，响应时间，引用分段，消耗tokens数量等关键指标。请查看MaxKB-API.zip压缩包，详细了解Python自动化测试脚本的内容。

滴答滴答嗒嗒滴

TensorZero：开源 LLM 应用优化与可观测性平台TensorZero 是一个开源的 LLM（大语言模型）应用全链路优化平台，聚焦于“数据—评估—优化—实验”自动化闭环，极大提升 LLM 产品的可观测性、可优化性和可扩展性。无论你是 GPT 应用开发者，还是需要管理和提升 LLM 服务质量的团队，TensorZero 都能帮你更快、更稳地跑通研发和运维全流程。

小白跃升坊

AI赋能文档创作：智能生成+云端下载，解锁高效办公新姿势本文重点介绍如何将AI智能生成文字直接转换为word文档，支持下载提升大家学习和职场办公的效率。Pandoc是一个功能强大的文档转换工具，支持多种文档格式之间的转换。它广泛应用于学术写作、出版和技术文档处理领域。 Pandoc支持多种输入和输出的格式，包括但不限于：