大模型

哥本哈士奇(aspnetx)2 小时前
大模型
提升 Text2SQL 准确率随着大语言模型的爆发,Text2SQL(自然语言转SQL)技术正在重塑我们与数据库的交互方式。本文将系统性地梳理提升 Text2SQL 准确率的核心方法,涵盖提示工程、模型微调、推理增强三大维度。所有示例基于微软 AdventureWorksDW2016 数据仓库。
zc.z5 小时前
langchain·大模型·springboot·rag智能体
基于 LangChain4j 的 RAG 工作流智能体实战在 AI 应用开发中,RAG(检索增强生成)已经成为构建智能问答系统的核心技术方案。然而,简单的 RAG 往往难以应对复杂的业务场景。本文将分享一个基于 LangChain4j 实现的 RAG 工作流智能体项目,支持顺序、条件、路由、循环、并行五种执行模式。
Komorebi_99999 小时前
学习·大模型
大模型学习day5在线 API 调用用第三方闭源模型接口(文心、通义千问等),前端发 HTTP 请求,拿返回结果。特点:不用部署、开箱即用、适合快速开发。
Komorebi_99999 小时前
大模型
大模型学习day4普通个人电脑(笔记本 / 台式):不管开源还是闭源,前端对接都靠 HTTP 接口和你平时调后端接口一模一样:
乔代码嘚10 小时前
人工智能·语言模型·面试·大模型·产品经理·ai大模型·大模型学习
2026 AI大模型全套资料免费领!30天从入门到架构部署,附面试真题与行业报告本文汇总2025年AI大模型全套学习资料包。包含30天系统学习计划(涵盖基础、微调、部署),100+本电子书、26份行业报告及600+套技术PPT。还提供大厂面试真题、面经及五阶段学习路线图,助力从入门到进阶,免费领取。
xixixi7777712 小时前
人工智能·安全·ai·大模型·合规·深度伪造·网信办
深度解读:网信办“清朗·整治AI应用乱象”专项行动,AI产业告别野蛮生长,全面迈入合规治理深水区2026年4月底,一则重磅消息在AI产业圈掀起轩然大波。中央网信办印发通知,在全国范围内部署开展为期4个月的“清朗·整治AI应用乱象”专项行动。
Resistance丶未来13 小时前
python·大模型·nlp·github·copilot·claude·gemini
Agency-Agents 多智能体协作系统落地指南在实际的企业开发场景中,我们常常遇到这样的困境:一个复杂的业务需求摆在那里,单靠一个大模型往往顾此失彼,要么逻辑链条断裂,要么在处理长上下文时丢失关键信息。比如处理一个跨部门的客户投诉,既需要查询订单历史,又要核对库存状态,还得生成安抚话术并触发退款流程。传统的单体智能体架构在这种多线程、高并发且逻辑耦合度极高的任务面前,显得力不从心。这正是多智能体协作系统(Multi-Agent Systems)大显身手的时刻。通过将宏大的目标拆解为多个具备特定技能的“角色”,让它们像一支训练有素的特种部队一样协同作战
.唉13 小时前
大模型·知识图谱·rag
03. GraphRAG:当知识图谱遇见大语言模型摘要:本文先简短回顾上篇RAG分块的内容,然后深入解析了GraphRAG的核心原理与应用场景,从知识图谱构建到社区检测算法,再到多级检索策略,带你全面理解这一大语言模型增强技术。作为AI学习者,掌握GraphRAG将为你打开复杂推理应用的大门。
程序员三明治16 小时前
java·人工智能·后端·大模型·llm·prompt·agent
【AI】Prompt 工程入门:从五要素框架到 RAG 生产级 Prompt 模板与 Java 实战在调用方式上,非流式调用会一次性返回完整结果;流式调用则可以实现类似“打字机效果”的逐字输出。但真正把大模型接入业务系统之后,你很快会发现:会调用 API 只是第一步,如何让模型稳定、准确、可控地回答问题,才是工程落地的关键。
kabuto_hui17 小时前
人工智能·大模型
【大模型系列】DLLM与Block Diffusion的区别与联系在传统自回归语言模型(如 GPT 系列)中,文本生成采用自回归 AR 模式:模型逐 token 预测下一个词元,将预测结果拼接入上下文后再继续预测,逐词生成完整句子。这种方式生成精度高,但无法并行生成多token,推理生成速度存在天然瓶颈。
eastyuxiao18 小时前
人工智能·大模型·文心一言·deepseek·deepseek-v4·deepseek‑v4
文心一言和DeepSeek V4哪个更好?做长文本 / 代码 / 深度推理选 DeepSeek V4;做中文合规 / 多模态 / 搜索联动选文心一言 5.0。下面从核心差异、能力对比、场景选型三方面说清楚。
Komorebi_999918 小时前
学习·大模型
大模型学习day6单轮对话一问一答,不记历史。每次请求都是独立的,大模型不知道上一句聊了啥。适合:简单一次性提问、查单个知识点。
庞轩px19 小时前
websocket·nginx·大模型·token·sse·流式输出·api密钥
第七篇:大模型API调用——从Token到流式输出在前面六篇文章中,我们从Embedding一路拆解到RAG和会话管理。但这些技术最终都要落到一个具体的操作上——调用大模型API。
weixin_5536544819 小时前
人工智能·语言模型·大模型
有没有一种可能,现在的大语言模型已经发展得接近极限了?说实话,最近这段时间,在各大技术沙龙和同行聚会中,我最常听到的一个问题就是:“大语言模型是不是已经快发展到天花板了?”从早期的惊艳四座,到如今在各种评测集上刷榜,再到企业落地时面临的种种瓶颈,这种焦虑和迷茫在技术圈里蔓延。
.唉19 小时前
大模型·rag·llamaindex
05. 从入门到实践: LlamaIndex与 RAG 应用构建摘要:本文聚焦LlamaIndex,作为LLM应用的核心数据框架,它搭建起通用大模型与私有数据的桥梁。文章系统拆解其四大核心流程:Loading完成文档加载与节点分割,Indexing构建向量索引实现语义检索,Storing借助StorageContext实现数据持久化,Querying提供自然语言查询接口。同时深入解析Workflows模块,涵盖事件驱动的控制流、状态管理与可视化调试能力。全文帮助开发者掌握从数据接入到复杂AI代理编排的完整路径,助力构建高效RAG应用。
庞轩px1 天前
网关·大模型·负载均衡·webflux·token限流·api密钥
大模型推理网关——从负载均衡到故障注入的完整设计在上一篇文章中,我们实现了AI课程问答助手,它能让用户通过SSE流式调用大模型。但这个方案有一个隐含的问题:API密钥直接暴露在后端代码中,单点调用,没有容灾。
哥本哈士奇(aspnetx)2 天前
大模型
SQLServer RAG笔记5:为SQLServer 2025配置Ollama在第三篇笔记中,我们结合Python代码,通过Ollama的嵌入模型,实现了为SQLServer 2025向量数据库生成向量值。从SQLServer 2025开始,是支持直接把大模型作为EXTERNAL MODEL的。此篇将介绍如何配置Ollama里的嵌入模型作为SQLServer 2025的EXTERNAL MODEL。
AI绘画哇哒哒2 天前
人工智能·学习·ai·程序员·大模型·产品经理·转行
RAG 系统中文档切分策略:如何选择合适的 chunk size?| 收藏这份实用指南,小白也能轻松上手大模型学习今天来聊一个RAG 项目里看起来很基础,但真正做起来特别容易翻车的问题:「RAG 系统中文档切分的策略有哪些?如何选择合适的 chunk size?」
Jinkxs2 天前
人工智能·深度学习·大模型·atomgit·glm-5
深度评测 GLM-5:AtomGit 首发模型的代码生成实战体验首发模型体验链接:https://atomgit.com/GitCode/0daymodel GLM-5模型在线体验连接:https://ai.atomgit.com/zai-org/GLM-5/model-inference?utm_source=tiezi 评测模型:zai-org/GLM-5 评测时间:2026年2月24日