llm

叫我少年5 小时前
llm
DeepSeek V4 Pro + Flash 分工编程:成本骤降 60%+ 的混合模型工作流Pro 和 Flash 到底怎么选?全用 Pro 太贵,全用 Flash 怕质量不行。这篇就来聊聊如何用「Pro 规划 + Flash 执行 + Pro 审查」的混合工作流,在不牺牲代码质量的前提下,把 API 费用砍掉一半以上。
OpenBayes贝式计算5 小时前
google·llm·agent
LongCat-Video-Avatar 1.5开源,具备全领域泛化能力的音频驱动视频生成模型;AI Student Impact Dataset 5 万量级多公共资源速递6 个公共数据集:* EAVSD 电商广告视频分镜数据集Movie Feelings 电影情感特征数据集
质造者6 小时前
大模型·llm·prompt·测试提升
Prompt工程从入门到进阶!基于通义千问实战零样本/少样本/CoT/攻防防范(附完整代码)很多同学调用大模型 API 时,常会遇到输出混乱、答非所问、风格不可控等问题;同时线上 AI 应用还普遍存在 Prompt 注入、模型越狱 等安全漏洞。 本文基于通义千问 + Streamlit 搭建可视化旅行助手,从零带你上手 5 大主流 Prompt 调优手法,并复现 3 类高危攻击与双层防护方案。全文代码开箱即用,适合 AI 入门、Python 实战、大模型安全方向学习。
星浩AI8 小时前
pytorch·深度学习·llm
(七)GPT2中文生成模型定制化微调训练[附源码]上一篇文章完成了 BERT 微调效果的系统测试与验收指标设计。本章进入生成式模型领域:使用 Hugging Face 上的 GPT-2 中文预训练模型,在本地语料上微调,训练一个中文古诗词生成模型。
慢慢向上的蜗牛12 小时前
llm·onnx·文本生成·自回归·kv-cache
Qwen3-0.6B ONNX(KV-Cache)模型部署本项目演示 Qwen3-0.6B ONNX 模型通过 onnxruntime 加载并进行自回归推理的完整实现。
Java陈序员13 小时前
rust·llm
一键测算!一款筛选本机可流畅运行的大模型终端工具!大家好,我是 Java陈序员。在如今的 AI 时代,各种开源大模型层出不穷。当我们想要在本地部署大模型时,既要熟悉模型运行参数,还要了解自己本地机器的硬件参数,普通开发者很难依靠零散的参数表格精准判断模型和硬件的适配性。往往是耗时下载了一个个大模型,结果却与本地机器不适配!
Together_CZ13 小时前
图像处理·人工智能·opencv·计算机视觉·llm·dnn·推理
OpenCV 5.0 重磅发布:全面技术深度解析从 C++ API 现代化到 ONNX 原生支持,OpenCV 5 带来了十年来最大的架构变革OpenCV 迎来了具有里程碑意义的 5.0 版本,这是一次彻底的重构。过去的 DNN 模块在处理 Transformer 等现代模型时显得力不从心,为此新版本完全重写了推理引擎,将 ONNX 算子支持率从 23% 大幅提升至 80% 以上,并且原生支持大语言模型(LLM)和视觉语言模型(VLM)的推理。在性能方面,CPU 上的推理速度是 PyTorch 原生模式的 2.3 倍,GPU 上也提升了 1.8 倍,同
呆呆敲代码的小Y14 小时前
人工智能·ai·llm·知识图谱·代码库·codegraph·代码知识库
CodeGraph 使用教程:专为代码库打造的知识图谱CodeGraph 是一个本地优先的代码智能工具,专为 AI 编程助手设计。它的核心思想是:与其让 AI 代理每次都用 grep/glob/Read 重新扫描文件,不如预先建好一张代码知识图谱,让代理直接查图作答。
qcx2314 小时前
人工智能·ai·llm·agent·agi
【AI daily 2026-06-10】RAG 2026 已进入“Agentic RAG“时代🔗 https://arxiv.org/abs/2601.01885 解决什么:LLM Agent 在长程任务中记忆管理割裂——LTM 和 STM 各自为政,无法协同优化 关键数据:5个 benchmark 平均 +49.59%(相对 no-memory),比 Mem0 高 +4.82pp;RL 训练后 token 反而 -3.1% 价值判断:今天刚读完的这篇直接指导 OpenClaw 记忆重构——“选择性记忆 > 全量存储”,Filter 工具使用率从 0.02→0.31 说明模型学会主动遗忘。RAG
海棠AI实验室14 小时前
windows·算法·自动化·llm·rag
AI 时代文献综述:从检索到成稿的 RAG 五步法写在前面:这是一篇写给程序员、算法工程师,以及所有被文献综述折磨过的工程师的文章。我们会讲清楚文献综述的核心概念(主题归纳 / 共识与分歧 / Gap)、AI 时代的RAG 思维(引用可追溯),以及一套可复用的通用五步法(检索 / 筛选 / 嵌入 / 提取 / 生成)。
冬奇Lab1 天前
人工智能·llm·agent
Agent 系列(18):成本与性能优化——省钱且更快一次 Agent 调用的成本拆解:优化方向只有两个:减少 Token 数 和 减少等待时间。本文用四个实验量化每种策略的实际收益。
吴佳浩1 天前
人工智能·llm·agent
Hermes vs OpenClaw:基于源码的 Agent Loop 全面分析作者:吴佳浩撰稿时间:2026-6-7最后更新:2026-6-10声明:本文所有结论均来自俺对两个仓库源码的分析和测(转载请注明出处 吴佳浩Alben) Hermes: github.com/NousResearch/hermes-agent OpenClaw: github.com/openclaw/openclaw
AndrewHZ1 天前
人工智能·gpt·深度学习·语言模型·llm·openai·规模定律
【LLM技术全景】规模定律与模型演进:为什么模型越大越强?摘要:本文是《LLM技术全景:从Token到部署》系列第五篇。大语言模型最令人震撼的现象之一是"规模定律"(Scaling Law)——模型性能随参数量、数据量、计算量的增加而可预测地提升。本期将深入解析Scaling Law的数学原理(Kaplan定律、Chinchilla定律)、模型演进的关键里程碑(BERT→GPT→LLaMA),以及为什么"大力出奇迹"在Transformer架构下依然有效。
装不满的克莱因瓶1 天前
人工智能·python·ai·langchain·llm·agent·chatmodel
了解 LangChain 中的 LLM 与 ChatModel 的差异目录前言一、LLM 与 ChatModel 的概念1. LLM2. ChatModel二、核心差异对比
颜酱1 天前
langchain·llm
LangChain 工具调用:从原理、入门到落地在大模型应用开发中,纯文本LLM无法解决实时计算、外部数据查询、API交互等落地场景问题。LangChain 工具调用能力,核心是将自定义Python函数、外部能力封装为大模型可识别、可自主调度的标准化工具,让LLM自主判断何时调用工具、传递什么参数,最终结合工具输出结果生成精准回答。
swipe1 天前
后端·面试·llm
做多轮对话 Agent,为什么我建议把短期记忆放到 Redis做 Agent 系统时,大家最先关注的往往是模型、Tool、工作流和 Prompt,但真正把系统跑到线上之后,最先暴露问题的通常不是模型,而是上下文。
swipe1 天前
面试·langchain·llm
别再把关系库和向量库拆开了:PostgreSQL 搭建 AI 长期记忆层实战这两年做 AI 应用,很多团队最先搭起来的是模型调用链路,最后最容易失控的却是数据层。一开始,大家通常只把 PostgreSQL 或 MySQL 当成“普通业务库”:用户表、订单表、会话表、消息表,该怎么建还怎么建。等产品开始要求“记住用户说过什么”“能从历史对话里找回相似上下文”“支持长期记忆”和“支持知识增强”时,问题就来了。
元Y亨H1 天前
大数据·llm
大数据转大模型(LLM)进阶学习路线图大数据工程师习惯于 Row/Column 的处理,大模型则基于 Tensor(张量)。这是所有现代大模型的“底座”,必须做到能从零手写核心代码。
小lan猫2 天前
前端框架·llm·agent
用 AI Agent 让购物更便捷:LumiGlow 电商网站实践最近在学习agent相关的落地,思考来源:“如何通过自然语言帮我们在传统电商网站下单?”,基于这个问题延展出了如下的落地设计思路: