llm

AI大模型7 分钟前
程序员·llm·agent
OpenAI 带你《从 0 到 1 打造 AI Agent:最全实战指南》(直白 + 权威)本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。💡 作为一名做 AI 应用落地的博主,我把这篇指南拆到了骨子里:文章讲了什么、用了哪些工程化范式、隐含了哪些设计假设、有哪些可复用的“硬骨头”,以及我对其优缺点与落地路径的专业评估。本文可当作你启动 Agent 项目的「施工图」。
AI大模型18 分钟前
google·llm·agent
Google 白皮书核心解析:AI Agent 落地开发全指南本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。Google发布的《Agents》白皮书,为AI Agent的工程化实践提供了系统性的技术框架。作为一线开发者,我们需要的不是概念解释,而是可操作的技术方案。本文基于白皮书内容,结合实际开发经验,为Agent应用开发者提供从架构设计到生产部署的完整技术路径。
智泊AI2 小时前
llm
大模型为啥按Tokens收费?Tokens究竟是什么?直到我理解了Token和分词器,我才懂Transformer你有没有这种感觉?看了很多Transformer、LLM的文章,却总觉得云里雾里?今天我们来聊聊大型语言模型(LLM)中的一个核心概念——Token。
信鑫6 小时前
llm·agent·强化学习
AIO Sandbox:为 AI Agent 打造的一体化、可定制的沙箱环境引言: AI Agent 在执行复杂任务时,常需在浏览器、代码执行、文件系统之间切换。传统多沙箱方案面临环境割裂、数据搬运、鉴权复杂等问题。AIO Sandbox 通过一个 Docker 镜像整合所有能力,提供统一文件系统与鉴权,并支持镜像定制,提升了 Agent 任务执行与交付效率。
潘小安21 小时前
算法·llm·claude
『译』迄今为止最强的 RAG 技术?Anthropic 的上下文检索与混合搜索原文:The best RAG’s technique yet? Anthropic’s Contextual Retrieval and Hybrid Search
AI大模型21 小时前
程序员·llm·agent
手把手教你本地部署大模型:CUDA与cuDNN环境配置全攻略本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。想在本地运行大模型,却卡在环境配置?CUDA和cuDNN是GPU加速的核心,但版本混乱、依赖冲突让无数人头疼。本文从零开始,带你避坑踩雷,5分钟搞定高性能环境,让大模型在你的电脑上“飞”起来!
AI大模型1 天前
程序员·llm·agent
手把手教你本地部署 Dify——打造属于自己的 AI 应用平台本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。Dify 是一个开源的 LLM(大语言模型)应用开发平台,由 LangGenius 团队开发。它提供可视化界面,支持:
yaocheng的ai分身1 天前
llm·github
Octoverse:AI 推动 TypeScript 登顶 #1,每秒都有新开发者加入 GitHub转载在今年的 Octoverse 报告中,我们揭示了 AI、代理和类型化语言如何推动软件开发领域十多年来最大的变革。
智泊AI1 天前
llm
13张图解Transformer和混合专家(MoE)的差别 | 大型语言模型的架构对比在自然语言处理(NLP)领域,‌Transformer模型‌因其卓越的表现能力已成为当前主导架构。然而,随着模型参数量的持续增长,‌计算资源消耗‌与‌实时推理延迟‌逐渐成为关键限制因素。为突破这一瓶颈,‌混合专家(Mixture of Experts, MoE)‌架构被提出并发展。
Goboy2 天前
llm·ai编程·trae
用Trae IDE+GLM4.6 API 搭了个小红书文案生成器,新手也能秒出爆款!附保姆级教程宝子们!作为每天要发3条小红书的带货博主,我之前天天卡在写文案这步——标题加不加emoji?标签怎么打才精准?明明产品很好,写出来就是没人看…直到上周用Trae IDE+GLM4.6搭了个专属文案生成网站,现在输入关键词,10秒就能出带排版、带标签、带爆款套路的文案,效率直接翻了5倍!今天就把方法教给你们,新手也能跟着做~
智泊AI2 天前
llm
终于有人把人工智能神经网络基本原理讲清楚了!生物学神经元:树突:一个神经元可以有多个树突,负责接收来自其他神经元的信号,并将这些信号传递到胞体。细胞核:维持神经元细胞的正常代谢活动,并处理来自树突的信息。
大模型教程2 天前
程序员·langchain·llm
dify和Langchain-Chatchat有什么区别?本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。今天介绍的开源项目 LangChain-Chatchat(原 Langchain-ChatGLM),便是一个旨在解决这一痛点的强大、全面且实用的解决方案。它不仅仅是一个简单的问答机器人,更是一个支持离线私有化部署的RAG与Agent应用搭建框架,让你能安全、高效地利用LLM处理特定领域的知识与任务。
AI大模型2 天前
程序员·llm·agent
什么是Embedding?Embedding的三大分类从“词袋”到“上下文”本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。在自然语言处理(NLP)的世界里,有一个词几乎无处不在——Embedding(嵌入表示) 。
大模型教程2 天前
程序员·llm·agent
记一次大模型检索增强系统中的一个问题——死板的RAG本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。“ RAG的机制决定了其执行流程比较死板,而Agent更符合人类的思维模式。 ”
AI大模型2 天前
程序员·llm·agent
想在 AI 领域弯道超车?这份 7 大 RAG 核心框架清单,你必须收藏!本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。在过去几年中,检索增强生成 (RAG) 的生态系统已经蓬勃发展。互联网上出现了越来越多旨在帮助开发者构建 RAG 应用的开源项目。这也是情理之中的事,因为 RAG 是一种用外部知识源来增强大型语言模型 (LLMs) 的有效方法。
Clain2 天前
人工智能·机器学习·llm
Ollama、LM Studio只是模型工具,这款工具比他俩更全面我试了Ollama、LM Studio,最后才发现“能离线用”的AI是什么样的过去我们用AI,总是绕不开“云端”。 每次调用模型,都要联网、等待、上传、再下载结果。
Qiuner2 天前
阿里云·大模型·llm·请求·apifox
大模型请求/响应参数完全拆解:每个字段都是什么意思?指定要使用的AI模型版本,不同模型具有不同的能力和特点。true: 模型可以联网搜索最新信息作为回答依据
nenchoumi31192 天前
人工智能·计算机视觉·llm·ocr·vlm·deepseek
LLM 论文精读(十二)DeepSeek-OCR: Contexts Optical Compression这篇论文是 DeepSeek 又一篇巨作,发表于 2025年10月21日,距离博客成文时间 2025年10月23日约 2 天时间,总算赶上热乎的了。作者也开源了模型权重和使用方式。全文总结下来就一句话:DeepSeek 开发了一个全新的编解码器,实现了用极少量的 vision tokens 达到高精度的 OCR 解析,同时作者认为由于这个模型对 tokens 的需求极少,未来可以扩展到超长文本的应用上。
CoderLiu3 天前
人工智能·llm
LLM API 成本的 3 个秘密:如何让服务商为你的复杂推理买单深入理解 LLM API 的定价策略,利用成本不对称性降低 70-90% 费用LLM API 的定价机制创造了一个有趣的现象:
智泊AI3 天前
llm
一文讲清Transformer工作原理,36张图解 Transformer01 整体视角我们先从高层角度看一下这个模型,把它当作一个黑盒来看。在机器翻译的应用中,它接收一段源语言的句子,输出目标语言的翻译结果。