大语言模型

deephub16 小时前
人工智能·大语言模型·agent·记忆
AI Agent的三重记忆机制:打造高可用的多维记忆系统大多数 AI Agent 项目都从模型开始。该用哪个模型?是用 GPT、Claude、Gemini、Llama,还是本地部署的模型?要不要加工具?要不要加 function calling?要不要让它自主运行?
wilbertzhou19 小时前
人工智能·llm·大语言模型·数据治理·元数据管理·语义元数据
大语言模型时代的语义元数据:从静态资产目录到智能治理元数据常被比喻为“数据的数据”——它告诉你在哪里能找到什么数据、数据从哪里来、当前质量如何。但在过去很长一段时间里,元数据管理面临一个根本性的矛盾:元数据本身需要被管理,而人工管理却跟不上数据爆炸的速度。正如DataHub团队所指出的,过去“能应付50个数据集的手动文档策略,在500个每小时更新的特征表面前会灾难性地崩溃”。
小白狮ww3 天前
人工智能·目标检测·计算机视觉·视觉检测·大语言模型·nvidia·locateanything
3B 参数,毫秒级响应:LocateAnything 如何重新定义开放世界目标检测来自 NVIDIA 的新作,LocateAnything-3B,主打视觉语言定位。说实话,看到「3B」这数字我第一反应:能有多能打?结果一看介绍,直接破防了。
deephub4 天前
人工智能·python·大语言模型·多智能体
2026 年开源 Agent 工具包选型指南:延迟、审计、可移植性与语言栈2026 年用于构建 agent 的开源工具包已经已经得到了巨大的发展,所以本篇文章将从以下角度来帮助你如何选择最适合你的工具:延迟预算、审计追踪、模型可移植性、还是语言栈。
谷哥的小弟4 天前
人工智能·深度学习·机器学习·大模型·大语言模型·梯度下降
大模型核心基础知识(17)—梯度下降梯度下降是模型训练中的基础优化方法。神经网络在完成前向传播和误差计算之后,还要进一步调整参数,使损失函数逐步减小。梯度下降所承担的任务,正是依据当前误差对参数进行迭代更新,使模型输出不断逼近目标结果。没有这一过程,模型虽然能够计算预测结果,却无法在训练中持续改进。
谷哥的小弟4 天前
人工智能·深度学习·神经网络·大模型·transformer·大语言模型
大模型核心基础知识(18)—Transformer模型的提出背景Transformer模型是现代大模型发展过程中的重要转折点。它改变了自然语言处理领域长期依赖循环结构进行序列建模的技术路径,使模型在并行计算能力、长距离依赖建模能力和大规模预训练适配性方面取得了明显进展。正是从Transformer开始,预训练模型的能力提升进入更快的发展阶段,后续BERT、GPT等代表性模型也大多建立在这一架构基础之上。
战族狼魂5 天前
人工智能·chatgpt·大模型·大语言模型·ai工程化
AI巨头IPO热潮引爆资本市场【今日综述】 今日AI领域迎来资本与技术的双重爆发,全球AI巨头竞速IPO成为市场焦点。OpenAI秘密提交IPO申请,估值超8500亿美元;中国AI企业集体加速资本化布局,智谱、MiniMax启动科创板IPO,阶跃星辰冲刺港股。具身智能赛道持续升温,宇树科技科创板IPO过会,英伟达联手宇树、Sharpa打造参考人形机器人。与此同时,AI与汽车产业深度融合,字节、阿里等科技巨头积极入局智能汽车领域,行业格局正在重塑 。
mpr0xy6 天前
人工智能·macos·ai·大语言模型·ai编程·ai写需求
行走编程:把你的 Mac 变成一台随身 AI 开发工作站前几个月,我发现自己的编程习惯正在发生变化。以前写代码的时候,我必须坐在电脑前:开发工作和电脑被牢牢绑定在一起。
雲明7 天前
语音识别·大语言模型·qwen·chainlit
Qwen2.5-7B-Instruct实战教程:Chainlit集成语音输入(Whisper API)你可能已经见过太多标着“7B”的大模型,但Qwen2.5-7B-Instruct不是简单参数堆砌的产物。它是在Qwen2系列基础上真正“长高长大”的一代——知识更广、逻辑更稳、表达更准,而且特别懂“人话”。
战族狼魂7 天前
人工智能·算法·chatgpt·大语言模型·ai提示词·ai工程化
AI 量化交易完整学习路线(从零到实战)这套课程大纲,已经不是“普通量化课”了,本质上是在培养:“AI 多智能体 + 量化交易 + 自动化交易系统”的复合型能力。
白萝卜弟弟8 天前
ai·大语言模型·agent
【Agent】不用折腾配置文件:用 CCSwitch 给 Codex 接入 DeepSeek / claw-cn 第三方大模型面向小白的 5 分钟上手教程。目标很简单:让 Codex 能用上第三方大模型,不用一上来就研究复杂配置。
带娃的IT创业者10 天前
人工智能·大语言模型·ai agent·gemini·技术解析·性价比·google i/o
Gemini 3.5 Flash 深度解析:重新定义“性价比“的前沿智能体在刚刚过去的 Google I/O 2026 大会上,人工智能领域的关注焦点毫无意外地聚焦于最新发布的 Gemini 3.5 Flash。作为 Gemini 3.5 系列的首发成员,它在 Hacker News 上引发了高达 888 票的热烈讨论。这不仅是因为 Google 宣称其在长上下文基准测试中比前代 Flash 3 性能提升了 42%,更因为它标志着"Flash"系列模型定位的根本性转变:从单纯的"轻量经济型"选项,正式跨越到了"前沿 Agent 级"智能体的行列。
纪伊路上盛名在12 天前
人工智能·大语言模型·vibe coding
Agnes AI 全家桶深度解析:文本、图像、视频,参数级使用指南周一的时候看到了一篇公众号推文,所以就趁着这个机会去试了下。官网参考:agnes-ai使用方式很简单,注册一个账号,然后获取api key,其余和前面介绍的LLM使用方式一致。
正在走向自律12 天前
大语言模型·rag系统
破局与重构:从 RAG 架构演进到 Agentic 实践的深度探索近年来,以 Transformer 架构为核心的大语言模型(Large Language Models, LLMs)以前所未有的速度重塑了人工智能的版图。它们展现出了惊人的文本生成能力、跨领域的知识储备以及强大的上下文学习(In-Context Learning)能力。然而,随着这些模型在企业级应用和严肃科研场景中的深入落地,其固有的局限性也逐渐暴露,成为了制约其进一步发展的“阿喀琉斯之踵”。
战族狼魂12 天前
大语言模型·提示词工程·ai工程化·prompt flow
用Prompt Flow管理提示词,从单条写到工程化最早接触大模型时,我的提示词都散落在各个聊天窗口里——某个周末调好的文案模板,下周想复用却找不到原句;同事问我「你那个摘要 prompt 怎么写的」,我只能凭记忆现场重敲,效果时好时坏。这种「单条写作」的模式,在个人尝鲜阶段勉强够用,一旦涉及团队协作、多场景复用,混乱就会指数级放大。
山科智能信息处理实验室13 天前
人工智能·深度学习·大语言模型
(AAAI-2026)KnowLP:GraphRAG 诱导双知识结构图,实现个性化学习路径推荐主要内容: 本文聚焦个性化学习路径推荐(Learning Path Recommendation, LPR)中的两个核心痛点:一是知识点之间的先修关系难以获取,依赖专家标注成本高;二是传统方法大多只沿着先修链条推荐,一旦学生在某个易混淆知识点上卡住,就会出现后续学习被阻断的现象。论文提出 KnowLP 框架,用 EDU-GraphRAG 自动构建知识点之间的先修关系图和相似关系图,再通过 DLRL(Discrimination Learning-driven Reinforcement Learning)
金融先生-Frank13 天前
大语言模型·ai部署·moe架构
Gemma-4-26B-A4B-it-GGUF镜像免配置:预置备份恢复脚本与模型版本灰度发布机制Gemma-4-26B-A4B-it-GGUF 是 Google Gemma 4 系列中高性能、高效能的 MoE(混合专家)聊天模型,具备256K tokens的超长上下文处理能力,原生支持文本+图像多模态理解。该模型在开源模型全球排名第6(Arena Elo 1441),采用Apache 2.0协议可免费商用。
带娃的IT创业者14 天前
github·大语言模型·ai agent·多智能体协作
大模型Agent的 Meta-Skill(元技能)在当今人工智能技术飞速发展的浪潮中,大语言模型(LLM)的能力已经从单纯的文本生成进化到了复杂的逻辑推理与任务执行。然而,随着应用场景的日益复杂,单一模型的局限性逐渐暴露,多智能体协作成为了新的技术高地。近期,一个名为 revfactory/harness 的项目在 GitHub 上迅速走红,以超过 5000 Star 的成绩引发了开发社区的广泛讨论。
deephub14 天前
人工智能·prompt·大语言模型·多智能体
Prompt Engineering 的本质:角色、任务、上下文、格式、约束如果你在 ChatGPT、Claude 或 Gemini 里输入过一个问题但是发现:“这不是我的意思”——那你已经碰到了 prompt engineering 的核心问题。
deephub15 天前
人工智能·大语言模型·rag·视频分块
视频 RAG 中分块策略:基于停顿、滑动窗口与基于 LLM 的方法文本的RAG我们都已经很熟悉了,但是如果数据以原始视频转录文本的形式存储,没有合适的时间结构,那么相比标准的 PDF 或文本文档,如何检索视频里面的内容呢? 针对同样的问题还可以换一个更高层次的问法: