大模型

流放深圳1 小时前
人工智能·大模型·ollama·springai
抓住 AI 人工智能的风口之第 1 章 —— 8万字熟练掌握 SpringAI 编程核心概念Spring AI 是 Spring 官方推出的 AI 应用开发框架,旨在帮助 Java 开发者以统一、便捷的方式将 AI 能力集成到企业级应用中。你可以把它理解为 Java 生态中的 "AI 万能转接头"。🎯 核心定位:简化 Java 开发者的 AI 集成。它的核心目标是解决 AI 模型 API 碎片化的问题。通过提供一套标准化的抽象接口,让开发者可以用一套代码调用 OpenAI、阿里云通义千问、DeepSeek 等几乎所有主流模型,更换底层服务只需修改配置,无需改动业务代码。
DogDaoDao1 小时前
人工智能·深度学习·自然语言处理·开源·大模型·github·textgen
【GitHub】TextGen:开源本地大模型运行平台的终极解决方案TextGen(原名 text-generation-webui,GitHub 曾用名 oobabooga/text-generation-webui)是当前最受欢迎的开源本地大语言模型(LLM)运行平台之一。该项目于2026年4月正式更名为 TextGen,GitHub 仓库地址变更为 github.com/oobabooga/textgen。
快跑bug来啦1 小时前
ai·大模型·知识图谱·知识库·rag
RAGFlow部署教程:Ubuntu24.04这两年深切的感受到AI的大爆发,干活越来越快也越来越懂自己了,但是完全依靠外在力量总感觉会对个人的成长不利,有工具不用也更像个傻子。AI本身不会形成壁垒,你能用别人也会用,想要在当前环境更突出,个人技术实力当然是一方面,毕竟AI是个人能力放大器;同时,同样的工具用的更好我觉得也是一方面,建立自己或者企业的知识库,让你的AI更懂自己,更贴近生产需要,作为知识沉淀我觉得是一个很好的方向。
AI原来如此2 小时前
ai·大模型·ai编程
2026最新Cursor零基础上手教程这是一篇面向零基础学生、职场新人、轻度技术爱好者的Cursor实战教程,所有操作均为2026年4月最新可复现版本,无需懂复杂AI原理,跟着步骤3分钟完成配置,用3个核心指令就能把编码相关效率提升3倍以上,不管是写课程作业、改老项目bug还是做小型开发项目都能用。
哥本哈士奇(aspnetx)10 小时前
大模型
Neo4j笔记(五):查询的处理流程上一篇讲述了一篇文章如何通过LLM转换成Cypher,然后在Neo4J里运行,形成知识图谱。此篇接着上篇,继续梳理一个用户查询,如何通过图数据库以及大模型去汇总查询结果。
handsomestWei13 小时前
大模型·llm·openai·模型接口
OpenAI 与 Anthropic 接口协议差异简述全文链接:OpenAI与Anthropic接口协议差异简述多数模型聚合网关会同时提供 OpenAI 兼容(如 …/v1)与 Anthropic 兼容(如 …/anthropic)两类入口。两套协议在路径、请求体、鉴权与流式响应上并不相同;分开展示是为了对齐各自官方 SDK 与既有工具链,降低迁移成本,而非单纯的技术能力不足。
伊玛目的门徒1 天前
人工智能·npm·大模型·ai编程·deepseek·claude code
用 npm 安装 Claude Code CLI 并对接 DeepSeek API 经验分享本文只写可直接复制的最简步骤,不废话,快速上手。Claude Code CLI 依赖 Node.js 运行时,直接从官网下载安装即可:
ghking11 天前
ubuntu·大模型·gnome·nvidia-smi·xorg·remote-desktop
ubuntu下部署大模型显存被其它程序占用问题解决用nvidia-smi查看显卡占用,发现xorg和gnome-remote-desktop总是占用几百兆的显存
贫民窟的勇敢爷们1 天前
语言模型·大模型
大模型发展现状解析——竞争格局与技术演进近年来,大模型技术进入爆发式发展阶段,全球范围内涌现出大量不同规模、不同类型的大模型,市场竞争日趋激烈,技术演进速度不断加快。从全球格局来看,中美两国成为大模型竞争的核心阵地,同时行业整合趋势明显,大模型正从“数量竞争”转向“质量竞争”与“生态竞争”,其发展现状呈现出多元化、差异化的特点。
贫民窟的勇敢爷们1 天前
大模型
大模型行业应用落地——从辅助工具到产业革新随着大模型技术的不断成熟,其应用场景已从最初的文本生成、智能问答,延伸到金融、医疗、制造、教育等多个行业,从“辅助工具”逐步升级为“产业革新的核心驱动力”。大模型凭借其泛化能力、高效迁移学习能力和涌现能力,能够快速适配不同行业的需求,解决行业痛点,提升生产效率,推动产业数字化转型。
布朗克1681 天前
人工智能·大模型·llm
大模型初步介绍:从基本概念到全球排行榜📅 数据更新日期:2026年5月8日 📊 数据来源:Arena AI Leaderboard大模型(Large Language Model, LLM) 是指基于海量数据训练、拥有数十亿甚至数万亿参数的深度学习模型。它们通过学习互联网上的文本、图像、视频等多模态数据,掌握了理解和生成人类语言、代码、图像乃至视频的能力。
贫民窟的勇敢爷们1 天前
大模型
解构大模型核心技术——从Transformer到多模态融合自2017年Transformer架构诞生以来,人工智能领域迎来了革命性突破,大模型正是基于这一架构逐步迭代,从单一语言处理演进为多模态协同的智能系统。如今,大模型已渗透到各行各业,但多数人对其核心技术的认知仍停留在“参数庞大”的表面,其背后的架构设计、训练范式与技术创新,才是支撑其强大能力的关键。
python零基础入门小白1 天前
人工智能·学习·大模型·agent·产品经理·ai大模型·大模型学习
驾驭智能体风暴:企业技术管理范式重构与落地实战指南AI Agent正在把企业技术管理的对象,从确定性的代码、接口和流程,推向具备感知、推理、记忆与行动能力的“数字劳动力”。这意味着管理者不能再只关注模型能力或提示词技巧,而要把上下文、权限、工具、审计、成本、组织角色与业务结果放入同一套工程体系中。本文围绕Agent架构、生产化难点、驾驭工程、安全治理、AgentOps与组织变革,整理一套面向企业落地的技术管理框架。
二进制_博客1 天前
大模型
pinecone向量数据库急速入门pinecone - 松果英式发音为/ˈpaɪnˌkəʊn/,美式发音为/ˈpɑɪnˌkoʊn/AI 向量数据库服务
雪碧聊技术1 天前
java·大模型·agent·全栈开发
大模型爆火!Java后端如何抓住Agent全栈开发的风口2026年的今天,AI Agent(人工智能体)已经不再是概念,而是企业级应用落地的核心。从智能客服到自动化办公,从代码助手到数据分析专家,Agent正在重塑软件开发的形态。
Mr.朱鹏2 天前
python·langchain·django·大模型·llm·virtualenv
5.LangChain零基础速通-LCEL链式调用定义:LangChain中的抽象基类(Abstract Base Class:ABC),Runnable是LangChain核心抽象接口统一组件调用方式,定义在langchain_core.runnables,支持LCEL组合,适配同步、异步、流式、批量等场景,是构建工作流的基础。
嵌入式小企鹅2 天前
人工智能·学习·算法·面试·职场和发展·大模型·面经
大模型算法工程师面试宝典目录🎁 宝典核心特色:三段式拆解,帮你“答到面试官心坎里”📖 宝典内容总览🔍 内容抢先看📥 如何获取这份《面试宝典》完整PDF?
Luca_kill2 天前
大模型·强化学习·agent框架·ai架构·hermes agent
深度解构 Hermes Agent:从“中央调度”到“自我进化”的架构哲学在 AI Agent 赛道日益拥挤的今天,Hermes Agent 凭借其与 Nous Research 的深度绑定以及独特的“自我进化”能力,迅速成为开发者关注的焦点。与 OpenClaw 等强调“即插即用”的个人助手框架不同,Hermes 更像是一个为工程化落地和模型深度定制而生的企业级架构方案。
Komorebi_99992 天前
大模型·rag
RAG-day2文档接入→ 文本分块→ 嵌入模型向量化→ 向量入库(存向量数据库)→ 用户提问向量化→ 向量库语义检索→ 拼接检索片段 + 用户提示词→ 大模型增强生成答案
Fleshy数模2 天前
人工智能·分类·大模型
基于 Qwen2.5-1.5B-Instruct 实现多轮对话与文本分类实践在大语言模型应用落地的过程中,多轮对话交互和文本智能分类是非常常见的场景。本文将以阿里云通义千问的 Qwen2.5-1.5B-Instruct 模型为例,详细讲解如何基于 Hugging Face 的 Transformers 库实现多轮对话交互、特定场景下的文本分类,以及连续对话交互功能,帮助开发者快速上手轻量级大模型的本地化部署与应用。