llm

堆栈future2 小时前
llm·aigc·openai
大模型时代的三巨头—Grok、ChatGPT与Gemini深度解析原文AI浪潮下的新范式:大模型崛起 2025年标志着人工智能领域的一个重要里程碑,多款大型语言模型(LLMs)的发布极大地推动了AI在推理、多模态处理和可扩展性方面的发展 。这些模型不仅代表着架构上的重大突破,也预示着AI系统将变得更加强大、情境感知能力更强,响应也更加迅速。埃隆·马斯克将当前AI的飞速发展形容为一场“智能大爆炸”,这表明AI的能力正在超越简单的聊天机器人功能,开始深入解决各个领域的复杂问题 。
大千AI助手2 小时前
人工智能·深度学习·机器学习·自然语言处理·llm·bert·transformer
BERT:双向Transformer革命 | 重塑自然语言理解的预训练范式本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
柠檬豆腐脑6 小时前
llm·agent
Trae-Agent中LLM Client深度分析在之前的文章,我们分析了Trae Agent整体执行思路和LLM是如何调用内置工具的一些细节。还有一块内容我觉得是有必要了解到,就是Agent对于LLM客户端的封装,毕竟每个供应商提供的LLM使用方式都有些差异,Agent需要将差异性封装起来,使我们使用LLM时使用一个统一的LLM Client对象就可以和LLM进行交互了。
在努力的韩小豪16 小时前
人工智能·python·llm·prompt·agent·ai应用·mcp
如何从0开始构建自己的第一个AI应用?(Prompt工程、Agent自定义、Tuning)在创建AI应用之前,你需要明确应用的目标,确定AI Agent的功能,以及它将如何与用户交互。问题示例:
weikuo05061 天前
llm
【手搓大模型】从零手写GPT2 — Attention前文我们讲述了 token Embedding和position Embedding,不过embedding从本质上依然是关于token自身的向量。一旦训练结束,embedding就是固定的weights了。我们需要引入一种新的机制,去关注token与token之间的依赖关系,也就是token所处的context。
weikuo05061 天前
llm
【手搓大模型】从零手写GPT2 — EmbeddingWhat I cannot create, I do not understand.—— Richard Feynman
小Lu的开源日常1 天前
人工智能·llm·api
AI模型太多太乱?用 OpenRouter,一个接口全搞定!在当今AI技术爆炸式发展的时代,大型语言模型(LLM)无疑是科技界最耀眼的明星。从 OpenAI 的 GPT 系列到 Anthropic 的 Claude,再到 Google 的 Gemini,市面上涌现出各种功能强大、各有千秋的模型。然而,这种繁荣也带来了一个让开发者头疼的问题:LLM生态系统的碎片化。
FLYINGPIG1 天前
langchain·llm
【Langchain】超详细构建Langchain架构下的MCP与Agent智能结合体在实现causalchat功能的时候,遇到了需要反复调用不同的工具的场景,如果只有一个mcp服务,那么也许不需要agent智能体的构建,但是如果一旦加入rag等复杂功能的实现,谁先谁后就不能在代码中进行硬编码了,为此我们将实现一个agent架构 相关文章: 【MCP】小白详解从0开始构建MCP服务端全流程 【RAG+向量数据库】小白从0构建一个rag和向量数据库demo
Baihai IDP1 天前
人工智能·ai·系统架构·llm·agent·rag·白海科技
AI 系统架构的演进:LLM → RAG → AI Workflow → AI Agent编者按: 当前 AI 系统建设中的一大痛点是:盲目追求先进技术而忽视业务实际需求,导致系统过度复杂、成本高昂、可靠性差。许多团队在 Agent 热潮中迷失方向,不知道何时该用简单的 LLM,何时需要 RAG,什么场景下才真正需要智能体。
柠檬豆腐脑1 天前
python·llm·agent
Trae-Agent 内置工具深度解析工具系统本质上是 LLM能力的外延 ,让AI能够与真实世界交互,执行具体的操作任务。 在我之前的认知中,LLM只是输入一堆文字后,再吐出一堆文字的东西。但是有个工具后,事情变得不一样了。这让我们编写一个可以与外界充分交互的Agent成为可能。
堆栈future1 天前
llm·aigc·mcp
深度剖析Manus:如何打造低幻觉、高效率、安全可靠的Agentic AI系统原文在人工智能和大模型技术飞速发展的今天,Agentic AI(智能体AI) 正成为产业界和开发者关注的焦点。而在这股浪潮中,Manus 作为一个备受瞩目的大模型智能体产品,以其卓越的性能和使用体验脱颖而出。那么,Manus究竟拥有哪些核心技术,使其能够迅速成为全球热点?今天,我们就来深度剖析Manus背后的技术奥秘。
AI大模型1 天前
程序员·llm·agent
大模型炼丹术(七):LLM微调实战:训练一个垃圾邮件分类器截止到现在,我们已经完成了LLM的整体架构搭建,是时候使用它来做一些下游的任务了。我们所构建的LLM是GPT2,官方开源了它的预训练权重。如果只是使用GPT2实现文本续写等功能,可以直接加载预训练模型并进行推理。
Paramita1 天前
神经网络·llm
LLM的魔法揭秘:神经网络在当今人工智能的浪潮中,大语言模型(LLM)如 OpenAI 的 GPT 系列、DeepSeek 等,凭借其强大的语言理解与生成能力,着实令人惊叹。这些模型为何如此智能?其实,这背后的关键力量便是神经网络。今天,我们就来探讨一下 LLM 背后的神经网络基本原理。
feihui1 天前
llm
跟着 Nanogpt 实践 TransformerFunction describes the world.( 非常喜欢的一句话 )每个 token 定义三个语义 embedding:query / key / value,对输入序列每个 token query embedding 和(输入序列中)每个 token key embedding 计算点积 ( 计算相似度 ),经 softmax 转换成概率后与 ( 输入序列中 ) 每个 token value embedding 向量相乘得到代表当前 token 的新向量。如此,不包含上下文的 static
302AI1 天前
人工智能·llm
全面刷新榜单,“全球最强 AI” Grok 4 评测:真实实力与局限性解析2025 年 7 月 10 日,全球 AI 领域再次迎来一场震撼级的技术革新。埃隆·马斯克旗下的 xAI 公司,在这一天正式向世界揭开了其最新一代大型语言模型 —— Grok 4 的神秘面纱。xAI 大胆宣称 Grok 4 是“全球最强大 AI”,并用一系列令人咋舌的基准测试成绩,强有力地支撑了这一论断。
AI大模型1 天前
程序员·llm·agent
大模型炼丹术(六):别只会用Greedy!6种主流LLM解码策略全面解析,附适用场景在使用训练好的LLM进行自回归预测下一个token时,我们会选择预测序列中最后一个token对应的预测tensor,作为解码操作的对象。
GA琥珀2 天前
llm
LLM系统性学习完全指南这篇文章将系统性的讲解LLM(Large Language Models, LLM)的知识和应用。我们将从支撑整个领域的数学与机器学习基石出发,逐步剖析自然语言处理(NLP)的经典范式,深入探究引发革命的Transformer架构,并按时间顺序追溯从BERT、GPT-2到GPT-4、Llama及Gemini等里程碑式模型的演进。随后,我们将探讨如何将这些强大的基础模型转化为实用、安全的应用,涵盖对齐技术(如RLHF)、高效微调(如LoRA)、检索增强生成(RAG)以及智能体(Agents)等高级主题。最后
可观测性用观测云2 天前
llm
OpenLLMetry 助力 LLM 应用实现可观测性大语言模型(LLM)的应用广泛且极具创新性,它通过强大的自然语言处理能力,为多个领域带来了深刻的变革。在内容创作方面,LLM 能够生成高质量的文案、故事、诗歌等,为作家、广告商和创意工作者提供灵感和辅助创作工具。在教育领域,它可以根据学生的学习进度和需求,生成个性化的学习材料和辅导内容,提升学习效果。在医疗行业,LLM 可以辅助医生解读病历、分析症状,甚至生成初步的诊断建议,为医疗决策提供支持。此外,LLM 还广泛应用于智能客服,能够快速响应用户问题,提供精准解答,提升客户满意度;在金融领域,它能够分析市
字节跳动安全中心2 天前
安全·llm·mcp
当AI智能体学会“欺骗”,我们如何自保?来自火山的MCP安全答卷本文旨在阐述火山引擎在模型上下文协议(Model Context Protocol, MCP)全生命周期中的安全保障实践。首先介绍MCP的核心概念、技术原理及生态发展现状,随后通过一个交互案例详细剖析其工作流程。核心部分深入分析了MCP面临的七种主要安全风险,包括传统Web服务风险及工具描述投毒、间接提示词注入等新型威胁,并结合具体案例进行说明。最后,本文提出了火山引擎针对性的MCP安全架构与保障方案,涵盖安全准入、原生安全设计及运行时防护等多个维度,旨在为行业构建安全的MCP生态提供参考。
硬核隔壁老王2 天前
人工智能·程序员·llm
AI大模型从入门到精通系列教程(二):解锁Prompt Engineering——从原理到高阶技巧的AI交互指南在人工智能蓬勃发展的今天,大语言模型(LLMs)已成为众多领域的核心驱动力。无论是智能客服、内容创作,还是数据分析,大语言模型都展现出了惊人的能力。但你是否想过,为何同样的问题,不同的提问方式会得到截然不同的回答?如何才能让大语言模型准确理解我们的意图,给出最符合需求的答案?这背后的关键,就是 Prompt Engineering。它是与大语言模型有效沟通的艺术,能挖掘模型的最大潜力。接下来,就让我们一同深入探索 Prompt Engineering 的世界。