大模型

ezeroyoung17 分钟前
华为·大模型·harmonyos
鸿蒙MindSpore Lite 离线模型转换指南最近一个项目涉及到识别婴儿哭声,因此做了一个离线模型进行测试,主要是根据开源库中的训练模型进行鸿蒙离线模型转化,本文档详细介绍如何使用 MindSpore Lite 转换器将训练好的模型转换为离线模型(.ms 格式),用于 HarmonyOS 端侧推理。
北邮刘老师25 分钟前
网络·人工智能·架构·大模型·智能体·智能体互联网
【智能体互联协议解析】ACPs/AIP为什么还在用“落后”的“中心化”架构?在介绍了AIP标准和北邮ACPs协议代码的背景后,今天开始进入技术环节。从第一个技术问题开始:【先看PPT后看文章】
北邮刘老师2 小时前
人工智能·大模型·智能体·智能体互联网
【智能体协议解析】一个完整的智能体互联协作流程在了解了ACPs/AIP的系统架构后,今天我们一起来看一个完整的智能体互联协作流程。【先看PPT再看文章】
Elwin Wong7 小时前
人工智能·langchain·大模型·llm·agent·codingagent
本地运行LangChain Agent用于开发调试在基于DeepAgents轻松构建 AI Coding Agent这篇文章中,我介绍了如何基于最新的 LangChain 1.0 和 DeepAgents 轻松构建一个简单但却功能强大和全面的 Coding Agent,其中还通过子 Agent 实现了代码审查、测试生成、文档生成、调试和代码重构等能力。
我很哇塞耶8 小时前
人工智能·ai·大模型
英伟达开源发布最新AI模型!引入突破性专家混合架构,推理性能超越Qwen3和GPT,百万token上下文,模型数据集全开源!Nemotron 3 支持 1M token 的上下文窗口,使模型能够在大型代码库、长文档、延展式对话以及聚合检索内容之上进行持续推理。与依赖碎片化分块启发式方法不同,智能体可以将完整的证据集合、历史缓冲区和多阶段规划全部保留在单一上下文窗口中。
zuoyou-HPU9 小时前
python·大模型·glm
ChatGLM4 的 tokenizer 配置文件解析tokenizer_config.json是 ChatGLM-4 的“对话协议 + Token 体系 + 工具调用模板”定义文件
找方案9 小时前
人工智能·笔记·学习·大模型
hello-agents 学习笔记:从概念到落地,初识智能体的奇妙世界最近跟着 datawhale 的 hello-agents 教程入门智能体,从模糊的概念到亲手写出可运行的程序,每一步都充满惊喜。今天就把这份学习笔记整理出来,和大家聊聊智能体的定义、类型、核心范式,还有我用 Deepseek 在 PyCharm 里实现的实操案例~
mingchen_peng1 天前
大模型·llm·hello-agent
第三章 大语言模型基础语言模型 (Language Model, LM) 是自然语言处理的核心,其根本任务是计算一个词序列(即一个句子)出现的概率。一个好的语言模型能够告诉我们什么样的句子是通顺的、自然的。在多智能体系统中,语言模型是智能体理解人类指令、生成回应的基础。本节将回顾从经典的统计方法到现代深度学习模型的演进历程,为理解后续的 Transformer 架构打下坚实的基础。
骚戴1 天前
java·人工智能·python·大模型·llm
深入解析:Gemini 3.0 Pro 的 SSE 流式响应与跨区域延迟优化实践Key Takeaways: 本文将从协议层分析 Google Vertex AI 与 OpenAI 接口在 SSE (Server-Sent Events) 处理上的差异,并分享在跨洋网络环境下,如何通过聚合层(Aggregation Layer)显著降低 Time-to-First-Token (TTFT) 延迟。
杨二K1 天前
大模型
大模型分块技术大模型分块之后,需要emdedding成高维度向量存储,用于后期的向量搜索。分的太大有什么问题: 分词之后,块太大导致向量维度会丢失,损失精度 分的太小有什么问题: 太小导致块太多,干扰搜索
骚戴1 天前
java·人工智能·python·大模型·api·vllm
DeepSeek V3 & Llama 3 推理避坑指南:自建 vLLM 集群 vs API 网关架构深度对比前言:2025年是大模型“百模大战”转入“推理落地”的关键一年。DeepSeek V3、Llama 3 70B 等开源权重的发布,让开发者有了更多选择。但当真正试图将这些模型部署到生产环境时,我们不仅要面对复杂的 CUDA 依赖,还要处理显存碎片、KV Cache 优化以及高昂的硬件成本。本文将从架构师视角,深度拆解目前主流的两种推理方案:自建高性能推理集群 与 使用 API 聚合网关。
世优科技虚拟人1 天前
人工智能·大模型·智慧城市·数字人·政务·智慧政务·智能交互
智慧政务从试点到普及:AI数字人一体机在政务大厅的深度应用分析当前,全球范围内数字政务转型步伐加快,“人工智能+”政务服务持续深化。在这一进程中,单纯的线上化、表单化已无法满足群众对政务服务能力的新期待。智慧政务的建设核心,正从后端系统打通向前端服务体验升级转移。AI数字人技术,特别是高度集成、开箱即用的数字人一体机,凭借其拟人化交互与业务办理引导能力,迅速从展厅、银行等场景走向政务大厅与政务中心,成为提升线下服务能力、补充窗口人力、塑造亲民智能政府形象的创新解决方案。
大千AI助手1 天前
人工智能·gpt·机器学习·开源·大模型·大千ai助手·gpt-neo
GPT-Neo:开源大型自回归语言模型的实现与影响本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
AndrewHZ1 天前
人工智能·大模型·llm·压力测试·模型部署·通义千问·qwen3-32b
【大模型技术学习】大模型压力测试全攻略:以Qwen3-32B为例在大模型落地生产环境的过程中,压力测试是不可或缺的一环——它能帮我们验证模型在高并发场景下的稳定性、响应效率和资源利用率,避免上线后出现服务崩溃、响应超时等问题。本文以阿里通义千问的Qwen3-32B模型为例,从核心指标、环境搭建、代码实现到结果分析,完整讲解大模型压力测试的全流程。
暴风鱼划水1 天前
人工智能·语言模型·自然语言处理·大模型·llm
大型语言模型(入门篇)A大型语言模型,通常缩写为LLMs,是人工智能(AI)和自然语言处理(NLP)的一部分。LLM本质上是一种AI模型,专门用于理解、生成和与人类语言文本交互,可以将其视为一个经过训练、能处理单词、句子和段落的复杂系统。 “大型语言模型”名称拆解:
般若Neo1 天前
大模型·大模型应用·企业级大模型
企业级大模型开发及应用 - 企业应用大模型的方法插件是一种将外部能力与大语言模型相结合的机制,可以帮助大模型访问最新信息、运行计算或使用第三方服务,比如访问网络、访问文档、与第三方应用相连接、绘图等。
todoitbo1 天前
人工智能·ai·大模型·dify·流处理·工具流
从零搭建 Dify AI 平台:一次跌宕起伏的部署之旅🎏:你只管努力,剩下的交给时间🏠 :小破站本文记录了在 CentOS Stream 9 服务器上使用 Docker Compose 部署 Dify 的完整过程,包括踩过的所有坑和解决方案。
herosunly2 天前
大模型·aigc·合合信息·文档神器·合合信息大模型加速器
大模型文档神器:合合信息大模型加速器大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
般若Neo2 天前
大模型·通用大模型·行业大模型·专属大模型
企业级大模型开发及应用 - 通用大模型与行业大模型从商业模式看,大模型已形成“基础 - 行业 - 应用”三层架构,三层服务相互促进,协同优化共同支撑产业转化和发展。
骚戴2 天前
人工智能·大模型·llm·api·ai gateway
架构视角:Gemini 3.0 Pro 原生多模态能力的边界与工程落地Abstract: 随着 Model-as-a-Service (MaaS) 的普及,如何在受限网络环境下构建高可靠的 GenAI 应用成为工程挑战。本文将分析 Gemini 3.0 Pro 的 Native Multimodal 架构特性,并探讨基于 n1n.ai 聚合网关(Aggregation Gateway)的跨区域调用方案。