llm

chenjim13 小时前
llm·agent
你的 Agent 是个黑箱:eBPF 如何看见它真正在做什么沙箱防逃逸,审批防越权,但 Agent 拿到合法权限后的行为——没人看得见。 本文首发地址 h89.cn/archives/62…
Lkstar13 小时前
数据库·人工智能·llm
万字长文Query改写与多路召回实战|从HyDE到RRF融合,召回率提升22%的完整方案Query 改写的本质,是在用户意图和检索系统之间搭一座桥。用户的原始 query 往往是口语化、不完整的,而检索系统需要的是结构化、语义明确的"搜索语言"。
AI语宙漫游指南14 小时前
深度学习·llm
从 CV 扩散到 NLP:详解 Google DiffusionGemma 架构、推理机制与优劣最近发现个好玩的大模型 DiffusionGemma-26B-A4B-it,这个模型有什么特别的呢?可以先看下下面这张图。
程序员cxuan15 小时前
ai·llm·agi
瑞幸出 CLI 了,这会是迈向 AGI 的第一步吗?昨天晚上刷到一个东西,瑞幸开放了 CLI,我第一反应是:这年头点杯咖啡也要进终端了?瑞幸出了 AI 开放平台,里面有 MCP、CLI、Skill。
智泊AI15 小时前
llm
为什么现在大家都在扎堆转 Agent 流程架构师?现在做大模型相关应用,比拼的核心早就不是模型参数量多大、或是写得多精巧的提示词,真正拉开差距的关键,是你给大模型搭出来的整套运行流程好不好。
去伪存真18 小时前
前端·pytorch·llm
如何将没有字幕的英文视频转换成中文视频?不管是学习还是娱乐,看视频时,难免会遇到一些没有中文字幕而自己又比较好奇讲了什么的英文视频,怎么办呢?今天教你一招,如何利用VideoLingo, 将没有字幕的英文视频转换成中文视频。先展示一下成果:
qcx2321 小时前
人工智能·ai·llm·agent·agi
【AI Daily 2026-06-05】 AI 方向的基础设施化,能力从模型层下沉到工具链和工作流今天 AI 工程最值得关注的是 AI 方向的基础设施化:Inverse Rubric Optimization: A testb、发布Linux 7.1内核大版本更新、andrewyng/aisuite 代表能力正在从模型层下沉到工具链和工作流。
DO_Community21 小时前
运维·服务器·开源·llm·agent
百亿参数开源模型托管成本账:从按 Token 计费到单卡 GPU 服务器怎么选?对于一个百亿参数以下的模型,难点不在于能不能托管——几乎任何服务商都能提供一台能跑得动的机器;真正的挑战在于找到与你的流量模式、定制需求和预算相匹配的托管方案。大多数人的目光都集中在大模型上,这很正常:它们因为参数规模大而性能最强。但越来越多的用户发现,随着 LLM 技术的进步,较小的模型已经能很好地满足他们的需求了。
大佐不会说日语~21 小时前
windows·docker·容器·llm·ollama
在 Windows 本地用 Docker 部署向量模型(bge-m3)在 CMD 里执行:检查输出中是否有 bge-m3。如果是空的或只有其他模型,请执行下一步。注意:务必盯紧日志,看到success才算成功。
啾啾Fun1 天前
ai·llm·agent·生产应用
【LLM应用可靠性】3-Agent 事故响应:当 AI 系统行为异常时的 SRE Runbook在生产环境中,若缺乏针对 Agent 系统的“紧急刹车”与“运行时控制面”设计,可能会导致异常行为无法在第一时间被阻断。本指南将介绍如何为 Agent 设计并实现符合 SRE 规范的事故响应机制(Runbook)。
程序员三明治1 天前
java·人工智能·后端·llm·元数据·rag·向量化
【AI】从文本到向量:理解Embedding的作用到这一步,知识库里的每个 chunk 已经有了清晰的上下文信息。但还有一个核心问题没有解决:这些内容仍然是自然语言,计算机并不能真正理解它们的含义。
带娃的IT创业者1 天前
安全·llm·大语言模型·开源项目·提示词工程·ai安全·系统提示词
解构黑盒:从开源项目看顶级大模型系统提示词的演进与安全边界在当今的人工智能开发领域,大语言模型(LLM)早已不再是简单的“对话机器”,而是演变成了具备复杂逻辑、工具调用能力和多模态处理能力的智能体。对于中级开发者而言,理解这些模型如何“思考”并不仅是为了满足好奇心,更是为了在实际工程中更精准地控制模型行为,减少幻觉,提升系统的鲁棒性。
_张一凡2 天前
llm·aigc·vlm·aigc前沿资讯·前沿资讯
【AIGC行业前沿】2026年6月AIGC行业前沿模型发布动态(6月8日-6月14日)目录:1、剪映首发 Seedance 2.0 系列新模型剪映通过官方小红书账号官宣,将于15日首发上线Seedance 2.0新模型。官方表示该模型相较前代生成速度更快、使用成本更低,首发期间将同步推出折扣优惠,目前官方正通过社交平台发起互动,邀请用户猜测具体折扣力度。 参考链接:https://www.xiaohongshu.com/user/profile/5cc0829f000000001100e8e0
山顶夕景2 天前
大模型·llm·蒸馏·rlvr·opd·opsd
【LLM】On-Policy Distillation Survery链接:https://arxiv.org/pdf/2604.00626f-散度最小化:OPD方法将训练过程重新组织为围绕学生采样的轨迹进行优化,目标是减少复合误差,使其线性化。公式如下: L O P D ( θ ) = E y ∼ π mix [ ∑ t = 1 ∣ y ∣ D f ( p T ( ⋅ ∣ x , y < t ) , p θ ( ⋅ ∣ x , y < t ) ) ] \mathcal{L}_{OPD}(\theta) = E_{y \sim \pi_{\text{mix}}} \left
万俟淋曦2 天前
人工智能·ai·机器人·大模型·llm·具身智能·vla
【论文速递】2026年第04周(Jan-18-24)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准标题: Agentic Reasoning for Large Language Models
iskyseraph2 天前
ai·llm·ai-coding
AI-Coding:2026世界杯实时看板, 支持AI聊天/竞猜/预测等2026 FIFA 世界杯开赛,周末一边看一边VIBE搭了一个纯静态、无后端的实时数据看板,开源在 GitHub。
wilbertzhou2 天前
人工智能·llm·大语言模型·数据治理·元数据管理·语义元数据
大语言模型时代的语义元数据:从静态资产目录到智能治理元数据常被比喻为“数据的数据”——它告诉你在哪里能找到什么数据、数据从哪里来、当前质量如何。但在过去很长一段时间里,元数据管理面临一个根本性的矛盾:元数据本身需要被管理,而人工管理却跟不上数据爆炸的速度。正如DataHub团队所指出的,过去“能应付50个数据集的手动文档策略,在500个每小时更新的特征表面前会灾难性地崩溃”。
CoderJia程序员甲2 天前
ai·大模型·llm·github
GitHub 热榜项目 - 周榜(2026-06-14)生成于:2026-06-14共发现热门项目: 18 个Token赞助:siliconflow前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。
星浩AI3 天前
pytorch·后端·llm
合规项目大模型如何部署?硬件选型 + vLLM/LMDeploy 实战如果你正接手一个合规项目——数据不能出域、访问要能审计、服务要能自己运维,大模型在内网落地——下面这些事,是不是也让你头疼过: