大模型

庞轩px5 小时前
网关·大模型·负载均衡·webflux·token限流·api密钥
大模型推理网关——从负载均衡到故障注入的完整设计在上一篇文章中,我们实现了AI课程问答助手,它能让用户通过SSE流式调用大模型。但这个方案有一个隐含的问题:API密钥直接暴露在后端代码中,单点调用,没有容灾。
哥本哈士奇(aspnetx)8 小时前
大模型
SQLServer RAG笔记5:为SQLServer 2025配置Ollama在第三篇笔记中,我们结合Python代码,通过Ollama的嵌入模型,实现了为SQLServer 2025向量数据库生成向量值。从SQLServer 2025开始,是支持直接把大模型作为EXTERNAL MODEL的。此篇将介绍如何配置Ollama里的嵌入模型作为SQLServer 2025的EXTERNAL MODEL。
AI绘画哇哒哒9 小时前
人工智能·学习·ai·程序员·大模型·产品经理·转行
RAG 系统中文档切分策略:如何选择合适的 chunk size?| 收藏这份实用指南,小白也能轻松上手大模型学习今天来聊一个RAG 项目里看起来很基础,但真正做起来特别容易翻车的问题:「RAG 系统中文档切分的策略有哪些?如何选择合适的 chunk size?」
Jinkxs9 小时前
人工智能·深度学习·大模型·atomgit·glm-5
深度评测 GLM-5:AtomGit 首发模型的代码生成实战体验首发模型体验链接:https://atomgit.com/GitCode/0daymodel GLM-5模型在线体验连接:https://ai.atomgit.com/zai-org/GLM-5/model-inference?utm_source=tiezi 评测模型:zai-org/GLM-5 评测时间:2026年2月24日
python零基础入门小白9 小时前
人工智能·学习·程序员·大模型·agent·产品经理·ai大模型
从0到1:手把手教你用Coze打造AI Agent,小白也能转行AI!字节开发的AI Agent工具,简单说:✅ 免费商用:Apache 2.0协议,练手、做项目、甚至商用都合法,不用怕版权问题; ✅ 门槛极低:双核CPU+4G内存就能跑(普通笔记本足够),不用买高端设备; ✅ 实战加分:用它做1个“AI客服Agent”项目,写进简历比“熟悉Python”更有说服力(企业招AI工程师超看重实战)。
python零基础入门小白10 小时前
人工智能·深度学习·学习·语言模型·大模型·transformer·产品经理
Transformer、Token、RAG全解析,一篇读懂大模型核心机制!本文以通俗易懂的方式,梳理了AI领域的关键术语,包括LLM、Transformer、Token、Embedding等,并深入探讨了它们的内在联系和应用场景。文章从模型构建、训练过程、应用方法等多个角度,全面解析了大模型的核心机制,帮助读者建立起对AI技术的整体认知框架。同时,文章还介绍了RAG、Agent等前沿技术,以及推理、部署和多模态等工程化问题,为读者提供了实用的技术指导。
庞轩px10 小时前
人工智能·ai·大模型·prompt·code review·aicoding
AI辅助编程的边界——Cursor实战与工程判断力在蚂蚁集团AI Coding笔试中,我用Cursor在1小时内完成了一个大模型推理网关的完整实现。坦白说,如果没有AI辅助,这个速度我做不到。但面试官可能会追问一句:“既然AI这么厉害,那程序员的价值在哪?”
庞轩px11 小时前
langchain·大模型·agent·tool·ai应用开发
LangChain不是“套壳”——它解决了什么实际问题在前面七篇文章中,我们拆解了Embedding、Transformer、幻觉、Prompt Engineering、RAG、会话管理和API调用。这些知识已经足够你从零开始搭建一个大模型应用。但你一定会遇到一个问题:
青山师12 小时前
大模型·prompt·aigc·ai编程·llama·claude·agi
【大模型提示词工程深度解析:从原理到工业级实践、实践案例】文章标签: #ai #提示词工程 #llm原理 #prompt-engineering #rag #agent
山顶夕景13 小时前
大模型·llm·mllm·多模态rag
【多模态RAG】Purifying Multimodal Retrieval【多模态RAG进展】打的点一个去噪工作。是现有 MRAG 框架均采用文档级检索与重排,默认文档内所有内容同等有效,但是检索文档含大量无关、冗余、矛盾噪声,引发 MLLM 幻觉,图像仅小区域感兴趣(ROI)有用,文本仅少量句子相关。所以,搞了个Retrieve–Rerank–Select–Generate四阶段 pipeline,新增片段级筛选模块净化证据,目标是在量化证据的边际效用,从而能够过滤掉通常会损害下游推理的无关、冗余或矛盾噪声,工作在《Purifying Multimodal Retrieval
AIGC安琪14 小时前
人工智能·深度学习·ai·语言模型·程序员·大模型·transformer
Transformer 和 LLM 到底是什么关系?现在大家聊大模型,总容易把两个词弄混:Transformer 和 LLM。有人觉得,Transformer 不就是大模型嘛。
Resistance丶未来14 小时前
gpt·ai·大模型·api·claude·gemini·hy3 preview
Hy3 Preview 免费模型快速上手指南在本地部署大语言模型时,很多开发者最头疼的往往不是模型本身的原理,而是如何让它真正跑起来。面对动辄几十 GB 的模型文件和复杂的依赖环境,初学者很容易在第一步就卡住。Hy3 Preview 作为一款免费的预览版模型,虽然在资源占用上做了不少优化,但要让它在你的机器上稳定运行并产出高质量内容,依然需要一套清晰的实操流程。
哥本哈士奇(aspnetx)1 天前
大模型
SQL Server RAG 笔记3:SQLServer2025 向量数据库在大模型RAG应用中,提起向量数据库大家想到的更多的是Chroma和FAISS,微软也紧跟时代的步伐,并且在2025年底发布的 SQLServer 2025 也提供了原生向量支持,此篇将介绍如何在SQLServer 2025里搭建向量数据库环境。
AI精钢1 天前
大模型·llm推理·kv cache·deepseek·ai工程
DeepSeek KV Cache 入门解读:98% 命中率背后的工程逻辑最近 Reddit 上有一个帖子引发了不少关注:一位开发者用 Claude 的 developer mode 对接 DeepSeek API 做 Web 开发,单日消耗了约 8900 万 tokens,总费用只有 4.39 元人民币(约 $0.64),缓存命中率高达 98.07%。
牧子川1 天前
人工智能·大模型·零样本
001-Zero-shot-Prompting💡 摘要:Zero-shot Prompting 是一种让 AI 模型在没有示例的情况下,仅通过指令就能完成任务的技术。本文将揭示其背后的原理,并分享 8 条实用的 Prompt 编写技巧。
AI精钢1 天前
大模型·llm·向量检索·rag·ai工程
如何提高 RAG 的检索质量?这才是真正的瓶颈所在有一句在 AI 工程圈流传的话:“RAG 没问题,问题出在你的检索层。”大多数开发者遇到 RAG 效果差时,第一反应是换更大的模型、调 temperature、改 prompt。折腾一圈发现没用——因为根本没对症。
薛定谔的猫3691 天前
人工智能·自动化·大模型·llm·ai agent
深入浅出:大语言模型 Agent 的工作原理与应用随着大语言模型(LLM)技术的飞速发展,AI Agent(人工智能智能体)作为一种能够感知、思考并采取行动的新型 AI 范式,正逐渐成为研究热点。本文旨在深入探讨 LLM Agent 的核心组成部分、工作机制及其在自动化任务中的潜力。
Resistance丶未来1 天前
gpt·大模型·llm·agent·claude·多智能体·trading agents
TradingAgents 多智能体交易框架深度评测在量化交易领域,单个策略模型往往难以应对复杂多变的市场环境。面对突发的宏观新闻、剧烈的盘中波动或是长期的趋势转换,单一算法容易陷入过拟合或反应迟钝的困境。近年来,多智能体系统(Multi-Agent Systems, MAS)的概念逐渐被引入金融工程,试图通过模拟专业交易团队的协作模式来突破这一瓶颈。TradingAgents 正是这一思路下的开源实践,它不再依赖一个“全能”的黑盒模型,而是将研究、分析、风控和执行等职能拆解给不同的智能体,让它们在一个共享环境中交互、辩论并最终达成交易共识。
E等于MC平方1 天前
人工智能·ai·大模型·模拟·物理·实验
AI 辅助物理课堂实验如何用「内置实验模板 + AI 路由」模式,在不生成任意代码的前提下,让 AI 辅助物理课堂实验?传统方案要么找一个通用物理模拟器(功能复杂、上手成本高),要么直接用静态图片讲解(缺乏交互感),要么让 AI 现场生成一段物理模拟代码(危险:生成代码的行为无法预测、无法测试)。
huisheng_qaq1 天前
人工智能·gpt·ai·chatgpt·大模型·transfomer
【AI入门篇-02】深入理解ChatGPT发展流程上一篇讲解了AI从感知智能到认知智能的发展流程,接下来这篇,就以比较有代表性的chatgpt为例子,来讲解一下整个AI的发展流程,所以这篇文章不会只讲 ChatGPT 本身,而是会以 GPT 系列的发展为主线,把背后的 Transformer、预训练、微调、指令微调、RLHF、多模态、RAG、Agent 等关键概念串起来。至于为什么选chatgpt也显而易见,因为chatgpt是将大语言模型推向大众视野的标志性产品