llm

冬奇Lab6 小时前
人工智能·llm·agent
Agent 系列(19):Harness 完整体系——8 层防护框架全景第 17 篇介绍了 Harness 的五个要素:动作空间、人工检查点、执行边界、审计日志、回滚。五要素是骨架,能处理大多数场景。
逻极6 小时前
架构·llm·agent·rag·多智能体系统·hermes agent·hermes
Hermes Agent深度探索:一个会自我沉淀经验的终端智能体第一次打开 Hermes Agent,很多人会把它归类成“带工具调用的命令行 AI 助手”。这个判断并不算错,但它只描述了最外层的使用体验。真正深入源码之后,你会发现它更像一个面向长期运行的 Agent 运行时——模型只是其中一个组件,工具、会话、记忆、技能、插件、安全策略、多平台入口和状态恢复共同构成了完整系统。
stereohomology12 小时前
llm·多模态编辑
让AI精确修改视觉可见的细节是繁琐的还是忍不住想上手怪不得Sora做不下去,Sora的客服处理投诉肯定很累。
AndrewHZ12 小时前
人工智能·深度学习·语言模型·开源·llm·transformer·基座模型
【LLM技术全景】开源大模型生态:如何选择适合你的基座模型?摘要:本文是《LLM技术全景:从Token到部署》系列第六篇。随着LLaMA开源引爆生态,现在已有数十个开源大模型可供选择。但"选择困难症"也随之而来:LLaMA、ChatGLM、Qwen、DeepSeek、Mistral……到底哪个更适合我的项目?本期将系统对比主流开源模型的技术特点、中文能力、部署成本,并提供一套"模型选择决策树",帮助开发者在2026年做出最合适的技术选型。
troubles maker15 小时前
llm·nlp·llama·多模态
LLaMA-Adapter V2: Parameter-Efficient Visual Instruction Model论文链接:https://arxiv.org/pdf/2304.15010大语言模型(Large Language Model,LLM)的落地应用中,轻量化微调是平衡性能、算力与部署成本的核心技术路线。相较于全参数微调、低秩自适应(Low-rank adaptation,LoRA)[1] 等主流方案,Adapter 架构以模块化、高兼容性的特点,被广泛应用于 LLaMA[2] 等开源大模型的下游迁移任务。
老梁agent15 小时前
物联网·llm
一个工程师的 LLM 理论入门:Transformer、Attention 和 Tokenization(不带公式)你不做算法研究,但你写 Agent。理解 LLM 怎么工作,能帮你写出更好的 @Tool 描述、更准的 SystemMessage、更省的 Prompt。
没有腰的嘟嘟嘟18 小时前
ai·llm·agent·rag·skill·spring ai·mcp
Easy-agent介绍目前,我的工作主要聚焦于 Agent 和 SKILL 相关领域。随着公司多个项目完成 Agent 化升级,我将项目集成 Agent 架构的经验进行总结和封装,最终开发出一个可复用组件——Easy-agent。
Shawn_Shawn18 小时前
后端·llm
Apache Doris Ai Function学习Apache Doris 是一款基于 MPP 架构的高性能、实时分析型数据库。随着大模型与向量检索技术在企业级场景的加速落地,从 Apache Doris 4.0 版本开始,Doris 围绕 "AI 驱动、搜索增强、离线提效" 三大方向进行了重大升级,正式将 AI 能力深度集成到数据库内核。
DigitalOcean19 小时前
llm·gpu
微调后的 LLM 如何部署到生产环境?从GPU 推理端点的搭建、测试与上线全流程想象一下这样一个产品团队:他们针对临床病历(Clinical Notes)对一个大语言模型进行了微调。在实验室测试中,提示词和模型生成的回答看起来都棒极了。然而,紧接着有人提出了一个棘手的问题:我们如何在不将受保护健康信息(PHI)暴露给共享公共 API 的前提下,把这个模型安全地接入面向患者的移动应用中?
叫我少年1 天前
llm
DeepSeek V4 Pro + Flash 分工编程:成本骤降 60%+ 的混合模型工作流Pro 和 Flash 到底怎么选?全用 Pro 太贵,全用 Flash 怕质量不行。这篇就来聊聊如何用「Pro 规划 + Flash 执行 + Pro 审查」的混合工作流,在不牺牲代码质量的前提下,把 API 费用砍掉一半以上。
OpenBayes贝式计算1 天前
google·llm·agent
LongCat-Video-Avatar 1.5开源,具备全领域泛化能力的音频驱动视频生成模型;AI Student Impact Dataset 5 万量级多公共资源速递6 个公共数据集:* EAVSD 电商广告视频分镜数据集Movie Feelings 电影情感特征数据集
质造者1 天前
大模型·llm·prompt·测试提升
Prompt工程从入门到进阶!基于通义千问实战零样本/少样本/CoT/攻防防范(附完整代码)很多同学调用大模型 API 时,常会遇到输出混乱、答非所问、风格不可控等问题;同时线上 AI 应用还普遍存在 Prompt 注入、模型越狱 等安全漏洞。 本文基于通义千问 + Streamlit 搭建可视化旅行助手,从零带你上手 5 大主流 Prompt 调优手法,并复现 3 类高危攻击与双层防护方案。全文代码开箱即用,适合 AI 入门、Python 实战、大模型安全方向学习。
星浩AI1 天前
pytorch·深度学习·llm
(七)GPT2中文生成模型定制化微调训练[附源码]上一篇文章完成了 BERT 微调效果的系统测试与验收指标设计。本章进入生成式模型领域:使用 Hugging Face 上的 GPT-2 中文预训练模型,在本地语料上微调,训练一个中文古诗词生成模型。
慢慢向上的蜗牛2 天前
llm·onnx·文本生成·自回归·kv-cache
Qwen3-0.6B ONNX(KV-Cache)模型部署本项目演示 Qwen3-0.6B ONNX 模型通过 onnxruntime 加载并进行自回归推理的完整实现。
Java陈序员2 天前
rust·llm
一键测算!一款筛选本机可流畅运行的大模型终端工具!大家好,我是 Java陈序员。在如今的 AI 时代,各种开源大模型层出不穷。当我们想要在本地部署大模型时,既要熟悉模型运行参数,还要了解自己本地机器的硬件参数,普通开发者很难依靠零散的参数表格精准判断模型和硬件的适配性。往往是耗时下载了一个个大模型,结果却与本地机器不适配!
Together_CZ2 天前
图像处理·人工智能·opencv·计算机视觉·llm·dnn·推理
OpenCV 5.0 重磅发布:全面技术深度解析从 C++ API 现代化到 ONNX 原生支持,OpenCV 5 带来了十年来最大的架构变革OpenCV 迎来了具有里程碑意义的 5.0 版本,这是一次彻底的重构。过去的 DNN 模块在处理 Transformer 等现代模型时显得力不从心,为此新版本完全重写了推理引擎,将 ONNX 算子支持率从 23% 大幅提升至 80% 以上,并且原生支持大语言模型(LLM)和视觉语言模型(VLM)的推理。在性能方面,CPU 上的推理速度是 PyTorch 原生模式的 2.3 倍,GPU 上也提升了 1.8 倍,同
呆呆敲代码的小Y2 天前
人工智能·ai·llm·知识图谱·代码库·codegraph·代码知识库
CodeGraph 使用教程:专为代码库打造的知识图谱CodeGraph 是一个本地优先的代码智能工具,专为 AI 编程助手设计。它的核心思想是:与其让 AI 代理每次都用 grep/glob/Read 重新扫描文件,不如预先建好一张代码知识图谱,让代理直接查图作答。
qcx232 天前
人工智能·ai·llm·agent·agi
【AI daily 2026-06-10】RAG 2026 已进入“Agentic RAG“时代🔗 https://arxiv.org/abs/2601.01885 解决什么:LLM Agent 在长程任务中记忆管理割裂——LTM 和 STM 各自为政,无法协同优化 关键数据:5个 benchmark 平均 +49.59%(相对 no-memory),比 Mem0 高 +4.82pp;RL 训练后 token 反而 -3.1% 价值判断:今天刚读完的这篇直接指导 OpenClaw 记忆重构——“选择性记忆 > 全量存储”,Filter 工具使用率从 0.02→0.31 说明模型学会主动遗忘。RAG
海棠AI实验室2 天前
windows·算法·自动化·llm·rag
AI 时代文献综述:从检索到成稿的 RAG 五步法写在前面:这是一篇写给程序员、算法工程师,以及所有被文献综述折磨过的工程师的文章。我们会讲清楚文献综述的核心概念(主题归纳 / 共识与分歧 / Gap)、AI 时代的RAG 思维(引用可追溯),以及一套可复用的通用五步法(检索 / 筛选 / 嵌入 / 提取 / 生成)。