大语言模型

白萝卜弟弟18 小时前
ai·大语言模型·agent
【Agent】不用折腾配置文件:用 CCSwitch 给 Codex 接入 DeepSeek / claw-cn 第三方大模型面向小白的 5 分钟上手教程。目标很简单:让 Codex 能用上第三方大模型,不用一上来就研究复杂配置。
带娃的IT创业者3 天前
人工智能·大语言模型·ai agent·gemini·技术解析·性价比·google i/o
Gemini 3.5 Flash 深度解析:重新定义“性价比“的前沿智能体在刚刚过去的 Google I/O 2026 大会上,人工智能领域的关注焦点毫无意外地聚焦于最新发布的 Gemini 3.5 Flash。作为 Gemini 3.5 系列的首发成员,它在 Hacker News 上引发了高达 888 票的热烈讨论。这不仅是因为 Google 宣称其在长上下文基准测试中比前代 Flash 3 性能提升了 42%,更因为它标志着"Flash"系列模型定位的根本性转变:从单纯的"轻量经济型"选项,正式跨越到了"前沿 Agent 级"智能体的行列。
纪伊路上盛名在5 天前
人工智能·大语言模型·vibe coding
Agnes AI 全家桶深度解析:文本、图像、视频,参数级使用指南周一的时候看到了一篇公众号推文,所以就趁着这个机会去试了下。官网参考:agnes-ai使用方式很简单,注册一个账号,然后获取api key,其余和前面介绍的LLM使用方式一致。
正在走向自律5 天前
大语言模型·rag系统
破局与重构:从 RAG 架构演进到 Agentic 实践的深度探索近年来,以 Transformer 架构为核心的大语言模型(Large Language Models, LLMs)以前所未有的速度重塑了人工智能的版图。它们展现出了惊人的文本生成能力、跨领域的知识储备以及强大的上下文学习(In-Context Learning)能力。然而,随着这些模型在企业级应用和严肃科研场景中的深入落地,其固有的局限性也逐渐暴露,成为了制约其进一步发展的“阿喀琉斯之踵”。
战族狼魂5 天前
大语言模型·提示词工程·ai工程化·prompt flow
用Prompt Flow管理提示词,从单条写到工程化最早接触大模型时,我的提示词都散落在各个聊天窗口里——某个周末调好的文案模板,下周想复用却找不到原句;同事问我「你那个摘要 prompt 怎么写的」,我只能凭记忆现场重敲,效果时好时坏。这种「单条写作」的模式,在个人尝鲜阶段勉强够用,一旦涉及团队协作、多场景复用,混乱就会指数级放大。
山科智能信息处理实验室6 天前
人工智能·深度学习·大语言模型
(AAAI-2026)KnowLP:GraphRAG 诱导双知识结构图,实现个性化学习路径推荐主要内容: 本文聚焦个性化学习路径推荐(Learning Path Recommendation, LPR)中的两个核心痛点:一是知识点之间的先修关系难以获取,依赖专家标注成本高;二是传统方法大多只沿着先修链条推荐,一旦学生在某个易混淆知识点上卡住,就会出现后续学习被阻断的现象。论文提出 KnowLP 框架,用 EDU-GraphRAG 自动构建知识点之间的先修关系图和相似关系图,再通过 DLRL(Discrimination Learning-driven Reinforcement Learning)
金融先生-Frank6 天前
大语言模型·ai部署·moe架构
Gemma-4-26B-A4B-it-GGUF镜像免配置:预置备份恢复脚本与模型版本灰度发布机制Gemma-4-26B-A4B-it-GGUF 是 Google Gemma 4 系列中高性能、高效能的 MoE(混合专家)聊天模型,具备256K tokens的超长上下文处理能力,原生支持文本+图像多模态理解。该模型在开源模型全球排名第6(Arena Elo 1441),采用Apache 2.0协议可免费商用。
带娃的IT创业者7 天前
github·大语言模型·ai agent·多智能体协作
大模型Agent的 Meta-Skill(元技能)在当今人工智能技术飞速发展的浪潮中,大语言模型(LLM)的能力已经从单纯的文本生成进化到了复杂的逻辑推理与任务执行。然而,随着应用场景的日益复杂,单一模型的局限性逐渐暴露,多智能体协作成为了新的技术高地。近期,一个名为 revfactory/harness 的项目在 GitHub 上迅速走红,以超过 5000 Star 的成绩引发了开发社区的广泛讨论。
deephub7 天前
人工智能·prompt·大语言模型·多智能体
Prompt Engineering 的本质:角色、任务、上下文、格式、约束如果你在 ChatGPT、Claude 或 Gemini 里输入过一个问题但是发现:“这不是我的意思”——那你已经碰到了 prompt engineering 的核心问题。
deephub8 天前
人工智能·大语言模型·rag·视频分块
视频 RAG 中分块策略:基于停顿、滑动窗口与基于 LLM 的方法文本的RAG我们都已经很熟悉了,但是如果数据以原始视频转录文本的形式存储,没有合适的时间结构,那么相比标准的 PDF 或文本文档,如何检索视频里面的内容呢? 针对同样的问题还可以换一个更高层次的问法:
追光者♂9 天前
人工智能·ai·大模型·大语言模型·claude·模型幻觉·架构参数
【测评系列5】CSDN AI数字营销实测体验官——Claude 大模型深度评测:从参数解析到实战边界《Claude大模型深度评测:从参数解析到实战边界》是一份针对Anthropic公司Claude大模型的全面性能评估报告。文章突破传统仅关注参数量大小的评测模式,建立了一套包含10个维度的实战评估体系:1)核心架构参数的技术解析;2)长上下文窗口极限压力测试;3)复杂逻辑与代码生成能力;4)多轮对话连贯性验证;5)安全对齐机制边界探测;6)典型幻觉场景复现分析;7)温度参数对创造性的影响;8)垂直领域专业度测试;9)响应速度与资源消耗评估;10)综合场景适配建议。评测特别强调实验室数据与实际应用的差距,通
谷哥的小弟9 天前
人工智能·深度学习·神经网络·大模型·大语言模型
大模型核心基础知识(14)—神经网络的结构神经网络是深度学习的重要基础,也是现代大模型得以形成和扩展的关键结构。它通过模拟人脑神经元之间的信息传递方式,构建具备学习和推理能力的计算模型。在机器学习发展过程中,神经网络之所以逐步成为重要技术路径,原因就在于它能够通过多层结构处理复杂输入,并在训练过程中不断调整内部参数,从而形成对数据规律的表达能力。理解神经网络,不仅要知道它由哪些部分构成,还要知道数据在其中是怎样流动的,模型又是如何依靠这种流动完成预测和学习的。
谷哥的小弟9 天前
人工智能·深度学习·机器学习·大模型·大语言模型
大模型核心基础知识(13)—深度学习的发展基础与技术特点深度学习是机器学习的重要分支,也是现代大模型得以发展的重要基础。它通过构建多层神经网络,对数据进行逐层表示和逐步抽象,从而实现特征提取、模式识别和结果预测。与早期机器学习方法相比,深度学习不再过度依赖人工设计特征,而是更强调通过数据训练自动形成表示能力。正因如此,深度学习在图像识别、语音识别和自然语言处理等领域取得了广泛应用,也为后续大模型的发展提供了方法基础。
谷哥的小弟9 天前
人工智能·深度学习·机器学习·大模型·大语言模型
大模型核心基础知识(12)—机器学习的基本概念与常见方法机器学习是人工智能的重要基础。机器学习关注的核心问题,是如何让计算机通过数据学习规律,并据此完成预测、判断和决策任务。与传统程序依赖人工逐条编写规则不同,机器学习更强调从数据中提取模式,再把这些模式转化为可计算的表示形式。正因为如此,机器学习不仅构成了现代人工智能的重要理论基础,也为后续深度学习和大模型的发展铺垫了方法路径。
Bioinfo Guy9 天前
大语言模型·skill
pdf-to-skill|把高分论文里的方法路线与图表逻辑,转化为可反复调用的Codex Skill模板想读一篇高分文献,但是不想只得到一份摘要。 想把论文里的研究思路、方法路线、图表逻辑,变成一个可以反复调用的 Codex Skill。
weixin_4684668512 天前
人工智能·ai·自然语言处理·大模型·云计算·大语言模型·本地化部署
大语言模型快速部署与调用指南在本地部署大语言模型时,很多开发者往往被繁琐的环境配置和显存瓶颈劝退。实际上,随着开源生态的成熟,将高性能模型跑在消费级显卡甚至普通服务器上已经变得相当可行。关键在于如何科学地规划资源、正确加载权重以及编写高效的推理代码。不少人在尝试过程中,常遇到依赖冲突、显存溢出或推理速度过慢等问题,这通常不是因为硬件不够强,而是缺乏对模型运行机制的深入理解。
带娃的IT创业者12 天前
人工智能·开源·llm·大语言模型·claude·语音交互·语音ai
开源语音AI的边界:从 `luongnv89/claude-howto` 看前沿技术的落地实践在AI技术飞速迭代的2025年,语音交互早已不再是简单的“你说我听”。随着大语言模型(LLM)能力的跃迁,前沿的语音AI正在向“情感理解”、“多轮对话”、“实时推理”等更深层次迈进。最近,一个名为 luongnv89/claude-howto 的开源项目在GitHub上悄然走红,它并非一个全新的模型,而是一套详尽的“实践指南”——教你如何利用Claude等前沿模型,构建具备“人味”的语音助手。
weixin_4684668512 天前
人工智能·python·深度学习·神经网络·语言模型·自然语言处理·大语言模型
大语言模型智能助手核心应用场景与落地指南在处理日常工作时,我们常常被淹没在海量信息中:几十页的技术文档需要快速提炼核心观点,散落在不同格式文件里的数据难以统一分析,或是面对复杂的业务逻辑迟迟无法下手编写代码。这种“信息过载”与“执行困难”的矛盾,几乎困扰着每一位知识工作者。很多时候,我们花费在整理、阅读和初步构思上的时间,远远超过了实际解决问题的时间。如果能有一个得力的助手,不仅能读懂超长文档,还能跨格式整合信息,甚至辅助推理和创作,工作效率将得到质的飞跃。
deephub13 天前
人工智能·设计模式·大语言模型·多智能体
Agentic 设计模式拆解:6 种结构的优缺点与应用场景Agentic AI 这项技术并不新,只是模型性能提高后让它从研究环境走向了可以规模化落地的阶段。所以这篇文章总结一些常见的设计模式,这些模式归纳了在大量已验证实现中反复出现的共性,可以视为一组结构化的骨架,用来理解智能体(Agent)、用户、模型和工具之间的核心交互。
deephub14 天前
人工智能·python·大语言模型·多智能体·harness
从零搭建 Harness Engineering 框架 :Rule、Skill、Sub-Agent等工程落完整路径Harness Engineering(脚手架工程)这个概念已经流行一阵了。网上大多数文章都停留在理论层面,反复解释为什么现代 AI 开发不能再依赖单个 Prompt、也不能把模型当成"聪明的代码自动补全"。不过这里有一个实际问题被反复提及: