大模型

程序员三明治2 小时前
java·人工智能·后端·大模型·llm·prompt·agent
【AI】Prompt 工程入门:从五要素框架到 RAG 生产级 Prompt 模板与 Java 实战在调用方式上,非流式调用会一次性返回完整结果;流式调用则可以实现类似“打字机效果”的逐字输出。但真正把大模型接入业务系统之后,你很快会发现:会调用 API 只是第一步,如何让模型稳定、准确、可控地回答问题,才是工程落地的关键。
kabuto_hui2 小时前
人工智能·大模型
【大模型系列】DLLM与Block Diffusion的区别与联系在传统自回归语言模型(如 GPT 系列)中,文本生成采用自回归 AR 模式:模型逐 token 预测下一个词元,将预测结果拼接入上下文后再继续预测,逐词生成完整句子。这种方式生成精度高,但无法并行生成多token,推理生成速度存在天然瓶颈。
eastyuxiao3 小时前
人工智能·大模型·文心一言·deepseek·deepseek-v4·deepseek‑v4
文心一言和DeepSeek V4哪个更好?做长文本 / 代码 / 深度推理选 DeepSeek V4;做中文合规 / 多模态 / 搜索联动选文心一言 5.0。下面从核心差异、能力对比、场景选型三方面说清楚。
Komorebi_99994 小时前
学习·大模型
大模型学习day6单轮对话一问一答,不记历史。每次请求都是独立的,大模型不知道上一句聊了啥。适合:简单一次性提问、查单个知识点。
庞轩px5 小时前
websocket·nginx·大模型·token·sse·流式输出·api密钥
第七篇:大模型API调用——从Token到流式输出在前面六篇文章中,我们从Embedding一路拆解到RAG和会话管理。但这些技术最终都要落到一个具体的操作上——调用大模型API。
weixin_553654485 小时前
人工智能·语言模型·大模型
有没有一种可能,现在的大语言模型已经发展得接近极限了?说实话,最近这段时间,在各大技术沙龙和同行聚会中,我最常听到的一个问题就是:“大语言模型是不是已经快发展到天花板了?”从早期的惊艳四座,到如今在各种评测集上刷榜,再到企业落地时面临的种种瓶颈,这种焦虑和迷茫在技术圈里蔓延。
.唉5 小时前
大模型·rag·llamaindex
05. 从入门到实践: LlamaIndex与 RAG 应用构建摘要:本文聚焦LlamaIndex,作为LLM应用的核心数据框架,它搭建起通用大模型与私有数据的桥梁。文章系统拆解其四大核心流程:Loading完成文档加载与节点分割,Indexing构建向量索引实现语义检索,Storing借助StorageContext实现数据持久化,Querying提供自然语言查询接口。同时深入解析Workflows模块,涵盖事件驱动的控制流、状态管理与可视化调试能力。全文帮助开发者掌握从数据接入到复杂AI代理编排的完整路径,助力构建高效RAG应用。
庞轩px19 小时前
网关·大模型·负载均衡·webflux·token限流·api密钥
大模型推理网关——从负载均衡到故障注入的完整设计在上一篇文章中,我们实现了AI课程问答助手,它能让用户通过SSE流式调用大模型。但这个方案有一个隐含的问题:API密钥直接暴露在后端代码中,单点调用,没有容灾。
哥本哈士奇(aspnetx)1 天前
大模型
SQLServer RAG笔记5:为SQLServer 2025配置Ollama在第三篇笔记中,我们结合Python代码,通过Ollama的嵌入模型,实现了为SQLServer 2025向量数据库生成向量值。从SQLServer 2025开始,是支持直接把大模型作为EXTERNAL MODEL的。此篇将介绍如何配置Ollama里的嵌入模型作为SQLServer 2025的EXTERNAL MODEL。
AI绘画哇哒哒1 天前
人工智能·学习·ai·程序员·大模型·产品经理·转行
RAG 系统中文档切分策略:如何选择合适的 chunk size?| 收藏这份实用指南,小白也能轻松上手大模型学习今天来聊一个RAG 项目里看起来很基础,但真正做起来特别容易翻车的问题:「RAG 系统中文档切分的策略有哪些?如何选择合适的 chunk size?」
Jinkxs1 天前
人工智能·深度学习·大模型·atomgit·glm-5
深度评测 GLM-5:AtomGit 首发模型的代码生成实战体验首发模型体验链接:https://atomgit.com/GitCode/0daymodel GLM-5模型在线体验连接:https://ai.atomgit.com/zai-org/GLM-5/model-inference?utm_source=tiezi 评测模型:zai-org/GLM-5 评测时间:2026年2月24日
python零基础入门小白1 天前
人工智能·学习·程序员·大模型·agent·产品经理·ai大模型
从0到1:手把手教你用Coze打造AI Agent,小白也能转行AI!字节开发的AI Agent工具,简单说:✅ 免费商用:Apache 2.0协议,练手、做项目、甚至商用都合法,不用怕版权问题; ✅ 门槛极低:双核CPU+4G内存就能跑(普通笔记本足够),不用买高端设备; ✅ 实战加分:用它做1个“AI客服Agent”项目,写进简历比“熟悉Python”更有说服力(企业招AI工程师超看重实战)。
python零基础入门小白1 天前
人工智能·深度学习·学习·语言模型·大模型·transformer·产品经理
Transformer、Token、RAG全解析,一篇读懂大模型核心机制!本文以通俗易懂的方式,梳理了AI领域的关键术语,包括LLM、Transformer、Token、Embedding等,并深入探讨了它们的内在联系和应用场景。文章从模型构建、训练过程、应用方法等多个角度,全面解析了大模型的核心机制,帮助读者建立起对AI技术的整体认知框架。同时,文章还介绍了RAG、Agent等前沿技术,以及推理、部署和多模态等工程化问题,为读者提供了实用的技术指导。
庞轩px1 天前
人工智能·ai·大模型·prompt·code review·aicoding
AI辅助编程的边界——Cursor实战与工程判断力在蚂蚁集团AI Coding笔试中,我用Cursor在1小时内完成了一个大模型推理网关的完整实现。坦白说,如果没有AI辅助,这个速度我做不到。但面试官可能会追问一句:“既然AI这么厉害,那程序员的价值在哪?”
庞轩px1 天前
langchain·大模型·agent·tool·ai应用开发
LangChain不是“套壳”——它解决了什么实际问题在前面七篇文章中,我们拆解了Embedding、Transformer、幻觉、Prompt Engineering、RAG、会话管理和API调用。这些知识已经足够你从零开始搭建一个大模型应用。但你一定会遇到一个问题:
青山师1 天前
大模型·prompt·aigc·ai编程·llama·claude·agi
【大模型提示词工程深度解析:从原理到工业级实践、实践案例】文章标签: #ai #提示词工程 #llm原理 #prompt-engineering #rag #agent
山顶夕景1 天前
大模型·llm·mllm·多模态rag
【多模态RAG】Purifying Multimodal Retrieval【多模态RAG进展】打的点一个去噪工作。是现有 MRAG 框架均采用文档级检索与重排,默认文档内所有内容同等有效,但是检索文档含大量无关、冗余、矛盾噪声,引发 MLLM 幻觉,图像仅小区域感兴趣(ROI)有用,文本仅少量句子相关。所以,搞了个Retrieve–Rerank–Select–Generate四阶段 pipeline,新增片段级筛选模块净化证据,目标是在量化证据的边际效用,从而能够过滤掉通常会损害下游推理的无关、冗余或矛盾噪声,工作在《Purifying Multimodal Retrieval
AIGC安琪1 天前
人工智能·深度学习·ai·语言模型·程序员·大模型·transformer
Transformer 和 LLM 到底是什么关系?现在大家聊大模型,总容易把两个词弄混:Transformer 和 LLM。有人觉得,Transformer 不就是大模型嘛。
Resistance丶未来1 天前
gpt·ai·大模型·api·claude·gemini·hy3 preview
Hy3 Preview 免费模型快速上手指南在本地部署大语言模型时,很多开发者最头疼的往往不是模型本身的原理,而是如何让它真正跑起来。面对动辄几十 GB 的模型文件和复杂的依赖环境,初学者很容易在第一步就卡住。Hy3 Preview 作为一款免费的预览版模型,虽然在资源占用上做了不少优化,但要让它在你的机器上稳定运行并产出高质量内容,依然需要一套清晰的实操流程。