llm

_张一凡15 小时前
llm·aigc·vlm·aigc前沿资讯·前沿资讯
【AIGC行业前沿】2026年6月AIGC行业前沿模型发布动态(6月8日-6月14日)目录:1、剪映首发 Seedance 2.0 系列新模型剪映通过官方小红书账号官宣,将于15日首发上线Seedance 2.0新模型。官方表示该模型相较前代生成速度更快、使用成本更低,首发期间将同步推出折扣优惠,目前官方正通过社交平台发起互动,邀请用户猜测具体折扣力度。 参考链接:https://www.xiaohongshu.com/user/profile/5cc0829f000000001100e8e0
山顶夕景17 小时前
大模型·llm·蒸馏·rlvr·opd·opsd
【LLM】On-Policy Distillation Survery链接:https://arxiv.org/pdf/2604.00626f-散度最小化:OPD方法将训练过程重新组织为围绕学生采样的轨迹进行优化,目标是减少复合误差,使其线性化。公式如下: L O P D ( θ ) = E y ∼ π mix [ ∑ t = 1 ∣ y ∣ D f ( p T ( ⋅ ∣ x , y < t ) , p θ ( ⋅ ∣ x , y < t ) ) ] \mathcal{L}_{OPD}(\theta) = E_{y \sim \pi_{\text{mix}}} \left
万俟淋曦20 小时前
人工智能·ai·机器人·大模型·llm·具身智能·vla
【论文速递】2026年第04周(Jan-18-24)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准标题: Agentic Reasoning for Large Language Models
iskyseraph20 小时前
ai·llm·ai-coding
AI-Coding:2026世界杯实时看板, 支持AI聊天/竞猜/预测等2026 FIFA 世界杯开赛,周末一边看一边VIBE搭了一个纯静态、无后端的实时数据看板,开源在 GitHub。
wilbertzhou20 小时前
人工智能·llm·大语言模型·数据治理·元数据管理·语义元数据
大语言模型时代的语义元数据:从静态资产目录到智能治理元数据常被比喻为“数据的数据”——它告诉你在哪里能找到什么数据、数据从哪里来、当前质量如何。但在过去很长一段时间里,元数据管理面临一个根本性的矛盾:元数据本身需要被管理,而人工管理却跟不上数据爆炸的速度。正如DataHub团队所指出的,过去“能应付50个数据集的手动文档策略,在500个每小时更新的特征表面前会灾难性地崩溃”。
CoderJia程序员甲1 天前
ai·大模型·llm·github
GitHub 热榜项目 - 周榜(2026-06-14)生成于:2026-06-14共发现热门项目: 18 个Token赞助:siliconflow前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。
星浩AI2 天前
pytorch·后端·llm
合规项目大模型如何部署?硬件选型 + vLLM/LMDeploy 实战如果你正接手一个合规项目——数据不能出域、访问要能审计、服务要能自己运维,大模型在内网落地——下面这些事,是不是也让你头疼过:
JouYY2 天前
websocket·llm·agent
如何实现基于 WebSocket Agent 的断线重连与状态恢复最近在做业务Agent开发时,遇到这样一个问题,当用户在 AI 流式输出过程中关掉页面、切换网络、或者刷新浏览器后,我们如何保证对话不丢失、状态可恢复。本文分享一下我们的实现方案。
树獭非懒2 天前
程序员·llm·agent
从N-gram到Transformer:大语言模型架构演进之路2023年以来,ChatGPT、GPT-4、Claude、Llama 这些名字频繁出现在我们的视野中。它们能写代码、翻译文档、创作故事,甚至通过律师资格考试——这一切能力的核心引擎,就是大语言模型(Large Language Model, LLM) 。
啾啾Fun2 天前
ai·llm·系统设计·rag
【LLM应用可靠性】2-RAG 生产失败模式:如何避免检索生成系统的性能退化许多 RAG(检索增强生成)系统在上线初期检索准确且响应迅速,但在运行一段时间后,可能会面临检索偏离、引用失效以及运行成本增加等问题。本文将系统梳理 RAG 在生产环境中的 12 大痛点与 9 种典型失败模式,并提供对应的工程治理方案。
郭东东2 天前
llm·ai编程·招聘
用数据工程与策略,推动模型持续进化|字节跳动招聘全栈研发工程师 - AI 数据与安全大模型继续进步,不只是算法问题。模型还缺什么能力?应该学习什么数据?如何规模化生产高质量数据?又如何验证训练后模型真的变强了?
harykali2 天前
人工智能·llm
Datawhale Hello-ROCm学习:初探Gemma4 #AMDev #Datawhale又到了和DataWhale一起学习的时候咯,这次我们的主题主要围绕ROCm展开今天就先从ROCm和Gemma4来开始吧
SkySeraph2 天前
llm·ai-coding
AI-Coding:2026世界杯实时看板2026 FIFA 世界杯开赛,周末一边看一边VIBE搭了一个纯静态、无后端的实时数据看板,开源在 GitHub。
qcx232 天前
人工智能·ai·llm·agent·agi·harness
提示工程已死,指令架构永生:深度复盘 GPT-5.5 与 Claude 4.7 带来的范式转移早期的提示工程常被视为一种“脆弱的玄学”或是“摸彩票”式的尝试,开发者在反复试错中寻找能触发正确答案的“咒语”。然而,随着 GPT-5.5 与 Claude 4.7 的发布,生成式 AI 已正式从文本续写的“概率机器”进化为对模型内部逻辑路径进行精确导航的“确定性执行引擎”。我们正在经历从随机的提示(Prompting)到严谨的“指令架构(Instruction Architecture)”的范式转移。现在的核心不再是文字的堆砌,而是构建一套精密的逻辑协议。
玉鸯3 天前
llm
Claude Fable 5 下架背后的真正问题:越狱是每个大模型的阿喀琉斯之踵2026年6月9日,Anthropic 发布了 Fable 5。三天后的傍晚,美国东部时间6月12日,一封来自商务部的信件被送到 Anthropic 总部。措辞很直接:立即禁止所有外国公民访问 Fable 5,包括 Anthropic 自己的外籍员工。整个模型下线。从发布到被封杀,不到96小时。
砍光二叉树3 天前
人工智能·llm·agent·skill·mcp
一文打通 AI 认知:LLM、Agent、MCP、Skill 完整体系很多开发者刚接触AI时,被大模型、Agent、MCP、Skill一堆新概念搞得一头雾水:ChatGPT只是大模型吗?Agent和普通聊天机器人区别在哪?MCP为什么被称作AI界USB-C?各个组件之间到底怎么配合工作?   本文先完整梳理AI70余年发展历程,用大白话拆解早期晦涩技术概念,再逐个详解当下AI基础核心知识点及核心技术,最后串联完整运行链路。全文无复杂公式、无晦涩术语,零基础也能读懂,轻松建立清晰的AI底层全局认知,后端、算法、应用开发同学均可收藏。
沐自礼3 天前
人工智能·llm
图像伪造识别和定位论文地址:https://arxiv.org/pdf/2410.02761FakeShield 处理图像的步骤如下:
XLYcmy3 天前
服务器·python·ai·llm·prompt·agent·token
一个基于 Python 的轻量级 LLM(大语言模型)API 客户端程序:从API交互到LLM应用架构一个基于 Python 的轻量级 LLM(大语言模型)API 客户端程序,其核心功能是通过 HTTP 协议与大语言模型服务进行交互,实现用户输入提示词(Prompt)并获取模型生成结果的能力。程序采用极简设计理念,仅依赖 requests库完成网络通信,通过预配置的服务器地址和认证令牌实现身份验证,最终以 JSON 格式处理响应数据。
智泊AI3 天前
llm
一文讲透 LLM 真实运行内核,这篇长文值得逐字细读!原文:How LLMs Actually Work,作者 0xkatoTL;DR:这篇文章把基于Transformer架构的大语言模型,完整拆解成九大运行环节,从输入内容到输出结果讲解得一清二楚,分别是分词、嵌入、位置编码、注意力机制、多头注意力、前馈网络、残差流与归一化、下一词预测循环。