大语言模型

deephub19 小时前
人工智能·大语言模型·rag·视频分块
视频 RAG 中分块策略:基于停顿、滑动窗口与基于 LLM 的方法文本的RAG我们都已经很熟悉了,但是如果数据以原始视频转录文本的形式存储,没有合适的时间结构,那么相比标准的 PDF 或文本文档,如何检索视频里面的内容呢? 针对同样的问题还可以换一个更高层次的问法:
追光者♂2 天前
人工智能·ai·大模型·大语言模型·claude·模型幻觉·架构参数
【测评系列5】CSDN AI数字营销实测体验官——Claude 大模型深度评测:从参数解析到实战边界《Claude大模型深度评测:从参数解析到实战边界》是一份针对Anthropic公司Claude大模型的全面性能评估报告。文章突破传统仅关注参数量大小的评测模式,建立了一套包含10个维度的实战评估体系:1)核心架构参数的技术解析;2)长上下文窗口极限压力测试;3)复杂逻辑与代码生成能力;4)多轮对话连贯性验证;5)安全对齐机制边界探测;6)典型幻觉场景复现分析;7)温度参数对创造性的影响;8)垂直领域专业度测试;9)响应速度与资源消耗评估;10)综合场景适配建议。评测特别强调实验室数据与实际应用的差距,通
谷哥的小弟2 天前
人工智能·深度学习·神经网络·大模型·大语言模型
大模型核心基础知识(14)—神经网络的结构神经网络是深度学习的重要基础,也是现代大模型得以形成和扩展的关键结构。它通过模拟人脑神经元之间的信息传递方式,构建具备学习和推理能力的计算模型。在机器学习发展过程中,神经网络之所以逐步成为重要技术路径,原因就在于它能够通过多层结构处理复杂输入,并在训练过程中不断调整内部参数,从而形成对数据规律的表达能力。理解神经网络,不仅要知道它由哪些部分构成,还要知道数据在其中是怎样流动的,模型又是如何依靠这种流动完成预测和学习的。
谷哥的小弟2 天前
人工智能·深度学习·机器学习·大模型·大语言模型
大模型核心基础知识(13)—深度学习的发展基础与技术特点深度学习是机器学习的重要分支,也是现代大模型得以发展的重要基础。它通过构建多层神经网络,对数据进行逐层表示和逐步抽象,从而实现特征提取、模式识别和结果预测。与早期机器学习方法相比,深度学习不再过度依赖人工设计特征,而是更强调通过数据训练自动形成表示能力。正因如此,深度学习在图像识别、语音识别和自然语言处理等领域取得了广泛应用,也为后续大模型的发展提供了方法基础。
谷哥的小弟2 天前
人工智能·深度学习·机器学习·大模型·大语言模型
大模型核心基础知识(12)—机器学习的基本概念与常见方法机器学习是人工智能的重要基础。机器学习关注的核心问题,是如何让计算机通过数据学习规律,并据此完成预测、判断和决策任务。与传统程序依赖人工逐条编写规则不同,机器学习更强调从数据中提取模式,再把这些模式转化为可计算的表示形式。正因为如此,机器学习不仅构成了现代人工智能的重要理论基础,也为后续深度学习和大模型的发展铺垫了方法路径。
Bioinfo Guy2 天前
大语言模型·skill
pdf-to-skill|把高分论文里的方法路线与图表逻辑,转化为可反复调用的Codex Skill模板想读一篇高分文献,但是不想只得到一份摘要。 想把论文里的研究思路、方法路线、图表逻辑,变成一个可以反复调用的 Codex Skill。
weixin_468466855 天前
人工智能·ai·自然语言处理·大模型·云计算·大语言模型·本地化部署
大语言模型快速部署与调用指南在本地部署大语言模型时,很多开发者往往被繁琐的环境配置和显存瓶颈劝退。实际上,随着开源生态的成熟,将高性能模型跑在消费级显卡甚至普通服务器上已经变得相当可行。关键在于如何科学地规划资源、正确加载权重以及编写高效的推理代码。不少人在尝试过程中,常遇到依赖冲突、显存溢出或推理速度过慢等问题,这通常不是因为硬件不够强,而是缺乏对模型运行机制的深入理解。
带娃的IT创业者5 天前
人工智能·开源·llm·大语言模型·claude·语音交互·语音ai
开源语音AI的边界:从 `luongnv89/claude-howto` 看前沿技术的落地实践在AI技术飞速迭代的2025年,语音交互早已不再是简单的“你说我听”。随着大语言模型(LLM)能力的跃迁,前沿的语音AI正在向“情感理解”、“多轮对话”、“实时推理”等更深层次迈进。最近,一个名为 luongnv89/claude-howto 的开源项目在GitHub上悄然走红,它并非一个全新的模型,而是一套详尽的“实践指南”——教你如何利用Claude等前沿模型,构建具备“人味”的语音助手。
weixin_468466855 天前
人工智能·python·深度学习·神经网络·语言模型·自然语言处理·大语言模型
大语言模型智能助手核心应用场景与落地指南在处理日常工作时,我们常常被淹没在海量信息中:几十页的技术文档需要快速提炼核心观点,散落在不同格式文件里的数据难以统一分析,或是面对复杂的业务逻辑迟迟无法下手编写代码。这种“信息过载”与“执行困难”的矛盾,几乎困扰着每一位知识工作者。很多时候,我们花费在整理、阅读和初步构思上的时间,远远超过了实际解决问题的时间。如果能有一个得力的助手,不仅能读懂超长文档,还能跨格式整合信息,甚至辅助推理和创作,工作效率将得到质的飞跃。
deephub6 天前
人工智能·设计模式·大语言模型·多智能体
Agentic 设计模式拆解:6 种结构的优缺点与应用场景Agentic AI 这项技术并不新,只是模型性能提高后让它从研究环境走向了可以规模化落地的阶段。所以这篇文章总结一些常见的设计模式,这些模式归纳了在大量已验证实现中反复出现的共性,可以视为一组结构化的骨架,用来理解智能体(Agent)、用户、模型和工具之间的核心交互。
deephub7 天前
人工智能·python·大语言模型·多智能体·harness
从零搭建 Harness Engineering 框架 :Rule、Skill、Sub-Agent等工程落完整路径Harness Engineering(脚手架工程)这个概念已经流行一阵了。网上大多数文章都停留在理论层面,反复解释为什么现代 AI 开发不能再依赖单个 Prompt、也不能把模型当成"聪明的代码自动补全"。不过这里有一个实际问题被反复提及:
不懒不懒7 天前
人工智能·大语言模型·通义千问·ai agent·ollama·react 框架·电商智能客服
【基于 ReAct 框架的电商智能客服 AI Agent 设计与实现】目录一、引言二、系统整体架构三、核心模块设计与实现3.1 环境依赖与项目目录结构3.2 模型配置文件 config.json
stereohomology8 天前
大语言模型·hallucination·engineering·harness
一直怕大模型幻觉,发现针对性harness约束能大大消除最近我在尝试让大语言模型(LLM)自动生成万字以上的长篇行业分析报告和技术调研文档。初看生成结果,文笔流畅、结构严谨,但当我进入人工审核环节时,却惊出一身冷汗:文中充斥着大量胡编乱造的数据、虚构的参考文献以及看似合理实则毫无根据的结论。
stereohomology9 天前
大语言模型·agent·cli·antigravity
Antigravity cli 体验很差1、感觉不如gemini cli; 2、额度绑定的antigravity 账户; 3、额度大大降低了,随便用几下就额度见底了; 4、这个cli还要像antigravity一样 review implementation plan,但又很难操作,说明做的人自己都不用,你自己都不用、还要让别人用,这不是应付领导安排的工作嘛 5、能用的LLM表现都很差,不是一般差,是很差;我平行对比,不如GLM5.1,deepseek V4Pro
deephub9 天前
人工智能·python·langchain·大语言模型·agent
推理 → 行动 → 观察:用 LangChain + Python 实现一个智能体循环如果你用过 ChatGPT 或 Claude的话对标准聊天机器人的工作方式应该不陌生:提问然后得到一个回答。但如果交给它一个多步骤任务呢?比如:“帮我找到最便宜航班,查询我的常旅客积分,并预订最佳选项”。
FunTester9 天前
人工智能·重构·大语言模型·sdd·ai时代qa范式重构
当 SDD 遇见 BDD:AI 时代 QA 范式的彻底重构“2 人 4 天完成 10 人数周的工作量”——这不是噱头,而是 AI-Native 团队用 Spec-Driven Development(SDD)创造的工程奇迹。当 SDD 与 BDD 深度融合,一种全新的 QA 范式正在诞生。
_张一凡10 天前
问答系统·大语言模型·文档解析·rag文档处理·mineru2.5
通往RAG之路(四):实战篇pdf文档解析为josn&md这是一个基于MinerU工具开发的批量文档智能解析与格式转换自动化脚本,核心作用是将 PDF、图片、Office 等格式的文档,批量转换为结构化的 Markdown 文本和 JSON 数据,适用于文档数字化、RAG 知识库构建、数据提取等场景。 我的文档全部是pdf,目前只是用到pdf输入。目前只是将pdf数据解析为 Markdown 文本和 JSON 数据。
deephub12 天前
人工智能·python·大语言模型·多智能体
告别脆弱的单体应用,用多智能体网络构建稳定的生产力工具多智能体系统代表了 AI 应用设计上的一次根本性转向,在过去几年,主流的一直是单智能体模型:一个 LLM、一条提示链(prompt chain)、一个系统包办所有事。这种范式在简单任务上能跑,到了复杂任务上就有一些力不从心了。
deephub13 天前
人工智能·大语言模型·强化学习·多智能体
2026 年面向 LLM 的 RL方法总结:从 PPO 到 DPO 到 GRPO,再到多智能体 RL强化学习一直是个执着于游戏、机器人和控制回路的小众子领域,直到ChatGPT 出现之后它就成了夹在“聪明的”基础模型与“有用的”产品之间的那一层。到现在差不多已经五年过去,整套流程至少被重写过三次;而被奖励的对象变化的程度甚至比执行奖励的算法本身还要剧烈。
deephub14 天前
人工智能·python·大语言模型·rag
构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭环检索增强生成(Retrieval-Augmented Generation,RAG)已经成为将大语言模型(Large Language Model,LLM)回答对接外部知识的主流方式。单 Agent 的 RAG Pipeline 却暴露出一个根本性矛盾:检索质量、推理深度和答案合成被揉进了同一次不透明的前向调用,难以评估、审计或系统性改进。