大模型

大千AI助手14 小时前
人工智能·神经网络·大模型·rag·检索增强生成·大千ai助手·graph-r1
Graph-R1:智能图谱检索增强的结构化多轮推理框架本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
Better Bench16 小时前
网络·人工智能·安全·大模型·组件·rag
【大模型RAG安全基准】安装和使用SafaRAG框架SafeRAG 是首个专注于系统化评估检索增强生成(RAG)管道安全风险的基准测试框架,特别针对中文场景。它揭示了攻击者如何通过操纵 RAG 流程中的数据流,导致模型生成不准确、有误导性甚至有害的内容。 SafeRAG 框架由以下几个核心部分组成:
CoderJia程序员甲16 小时前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-11-06)生成于:2025-11-06共发现热门项目:18 个榜单类型:日榜本期GitHub热榜呈现出AI Agent与智能化工具的强劲发展态势。多Agent舆情分析、AI浏览器自动化(Skyvern)、智能代码生成(DeepCode)等项目集中涌现,标志着Agent技术正从理论走向实用化场景。本地化AI推理(LocalAI)和开源AI平台热度持续,反映开发者对去中心化、隐私优先解决方案的强烈需求。同时,终端界面开发(OpenTUI)、AI编码助手(OpenCode)等开发者工具创新活跃,显示开发体验优化成为新焦点
喜欢吃豆1 天前
人工智能·microsoft·自然语言处理·大模型
OpenAI Agent 工具全面开发者指南——从 RAG 到 Computer Use —— 深入解析全新 Responses API工具使用 (Tool Use) 是一个核心范式,标志着大型语言模型(LLM)从被动的文本生成器向主动“代理”(Agent)的转变。 模型不再局限于已训练的知识,而是通过调用外部工具与世界交互,例如:
居7然1 天前
人工智能·深度学习·大模型·transformer·embedding
Attention注意力机制:原理、实现与优化全解析在深度学习处理序列数据(如文本、语音、时序信号)的过程中,传统循环神经网络(RNN)和卷积神经网络(CNN)存在明显局限:RNN难以并行计算且长序列下信息传递衰减,CNN则对长距离依赖捕捉能力较弱。Attention注意力机制的出现突破了这一瓶颈,其核心思想是让模型在处理序列时“有的放矢”——通过学习输入序列不同部分的重要性权重,对关键信息进行显式加权,从而高效聚焦与输出相关的内容。本文将从Attention的基础原理出发,逐步深入Transformer中的应用、计算复杂度优化、KV缓存技术,以及MHA、
大千AI助手1 天前
人工智能·神经网络·lora·大模型·llm·大千ai助手·稀疏微调
探索LoSA:动态低秩稀疏自适应——大模型高效微调的新突破本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
Wu Liuqi2 天前
人工智能·学习·自然语言处理·大模型·大模型转行
【大模型学习】第一章:自然语言处理(NLP)核心概念自然语言处理(Natural Language Processing, NLP)是人工智能领域(AI)的一个重要分支,目标是使计算机能够理解、解释并生成人类语言,实现自然、无障碍的人机交互。随着信息技术的发展,NLP已成为从海量文本中提取信息、理解语言深层含义的核心工具。本章旨在为您系统地介绍NLP的基础知识,包括其定义、发展脉络、主要任务及关键的文本表示技术。
bestcxx2 天前
大模型·提示词·system·user·assistant
0.5、提示词中 System、User、Assistant 的基本概念https://console.anthropic.com/dashboard上图展示了一个标准的多轮对话构建界面。 这三个角色各司其职,共同构成一个完整的对话单元(Message Pair)
糖葫芦君2 天前
人工智能·深度学习·大模型
基于树结构突破大模型自身能力相关论文:当前大语言模型在复杂推理、规划与决策领域的一些重要前沿进展。它们核心是探索如何通过不同的树形结构搜索算法或测试时计算分配,来突破模型自身能力的限制。
小白狮ww2 天前
人工智能·深度学习·机器学习·大模型·分子动力学·计算机程序·vasp
VASP 教程:使用 VASP 进行机器学习力场训练Vienna Ab initio Simulation Package(VASP,The VASP Manual - VASP Wiki)是一个计算机程序,用于从第一性原理进行原子尺度材料建模,例如电子结构计算和量子力学分子动力学。
Mr.zwX2 天前
大模型·注意力机制·gpt-oss
GPT-OSS大模型Attention架构设计大模型推理时,在大部分层上能观察到注意力很大程度关注到开头的几个token上,在StreamingLLM中被称为attention sink。究其原因,并不是开头的token一定最重要,而是当大模型无法有效关注到主要token时,由于开头的token能被后面所有token看到,所以表现出很高的attention score。
hzp6662 天前
人工智能·语言模型·大模型·llm·智能体·tokencake
基于大语言模型(LLM)的多智能体应用的新型服务框架——Tokencake面向基于大语言模型(LLM)的多智能体应用的新型服务框架——Tokencake。其核心目标是优化多智能体场景下 KV Cache 的管理效率,从而显著提升系统性能与资源利用率。
大千AI助手2 天前
人工智能·神经网络·lora·大模型·lift·大千ai助手·稀疏微调
LIFT:基于低秩引导的稀疏微调本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
逐云者1232 天前
大模型·fastapi·router·分层架构·算法工程·算法服务
使用 FastAPI 构建大模型应用的系统教程(工程化实战指南)本文面向希望将大语言模型(LLM)能力落地为可部署服务的工程师、算法开发者与AI产品研发团队。我们将以 FastAPI 为核心框架,从架构设计、代码组织、配置治理、Prompt管理、模型集成、到部署监控,全流程讲解如何构建一个高性能、可维护的大模型应用系统。
KG_LLM图谱增强大模型3 天前
大模型·知识图谱·工具·科学研究·graphrag
[Nature子刊]浙大SciToolAgent:用知识图谱驱动的科学智能体实现多工具集成本文介绍了SciToolAgent,一个基于大语言模型的科学智能体,可自动化处理生物学、化学和材料科学领域的数百个专业计算工具,通过构建科学工具知识图谱实现智能工具选择和执行,显著提升科研效率。
多喝开水少熬夜3 天前
图像处理·python·算法·大模型·llm
损失函数系列:focal-Dice-vgg详细介绍可参考1参考2Focal Loss在论文《Focal Loss for Dense Object Detection 》中被提出,主要用于解决样本数据中的类别不平衡问题。它是在标准交叉熵损失基础上的改进,通过动态调整易分类样本的权重,使模型在训练过程中更加关注难分类样本。
Cyril_KI3 天前
大模型·llm·github·综述·幻觉
大模型长文生成中的幻觉与事实性:研究进展综述上一篇笔记介绍了我们提出的KLCF框架:基于知识一致性验证的强化学习框架:提升大模型在长文生成中的事实性
喜欢吃豆4 天前
人工智能·语言模型·架构·大模型·llama·llama.cpp·gguf
掌握本地化大语言模型部署:llama.cpp 工作流与 GGUF 转换内核全面技术指南llama.cpp 不仅仅是一个软件工具,它更是一个关键的开源项目,其核心使命是推动大语言模型(LLM)的普及化。该项目秉持“CPU 优先”的设计哲学,通过精湛的 C++ 实现和底层优化,使得在没有昂贵高端图形处理单元(GPU)的消费级硬件上运行强大的语言模型成为可能。这一特性极大地降低了开发者、研究人员和技术爱好者探索和应用前沿人工智能技术的门槛,从而催生了一个活跃的本地化 AI 应用生态系统。
长颈鹿仙女4 天前
python·大模型
发送 Prompt 指令:判断用户评价是好评还是差评
山顶夕景4 天前
深度学习·大模型·强化学习
【RL】Scaling RL Compute for LLMs论文:The Art of Scaling Reinforcement Learning Compute for LLMs 链接:https://arxiv.org/abs/2510.13786