llm

玉鸯10 小时前
llm
Claude Fable 5 下架背后的真正问题:越狱是每个大模型的阿喀琉斯之踵2026年6月9日,Anthropic 发布了 Fable 5。三天后的傍晚,美国东部时间6月12日,一封来自商务部的信件被送到 Anthropic 总部。措辞很直接:立即禁止所有外国公民访问 Fable 5,包括 Anthropic 自己的外籍员工。整个模型下线。从发布到被封杀,不到96小时。
砍光二叉树11 小时前
人工智能·llm·agent·skill·mcp
一文打通 AI 认知:LLM、Agent、MCP、Skill 完整体系很多开发者刚接触AI时,被大模型、Agent、MCP、Skill一堆新概念搞得一头雾水:ChatGPT只是大模型吗?Agent和普通聊天机器人区别在哪?MCP为什么被称作AI界USB-C?各个组件之间到底怎么配合工作?   本文先完整梳理AI70余年发展历程,用大白话拆解早期晦涩技术概念,再逐个详解当下AI基础核心知识点及核心技术,最后串联完整运行链路。全文无复杂公式、无晦涩术语,零基础也能读懂,轻松建立清晰的AI底层全局认知,后端、算法、应用开发同学均可收藏。
沐自礼13 小时前
人工智能·llm
图像伪造识别和定位论文地址:https://arxiv.org/pdf/2410.02761FakeShield 处理图像的步骤如下:
XLYcmy17 小时前
服务器·python·ai·llm·prompt·agent·token
一个基于 Python 的轻量级 LLM(大语言模型)API 客户端程序:从API交互到LLM应用架构一个基于 Python 的轻量级 LLM(大语言模型)API 客户端程序,其核心功能是通过 HTTP 协议与大语言模型服务进行交互,实现用户输入提示词(Prompt)并获取模型生成结果的能力。程序采用极简设计理念,仅依赖 requests库完成网络通信,通过预配置的服务器地址和认证令牌实现身份验证,最终以 JSON 格式处理响应数据。
智泊AI18 小时前
llm
一文讲透 LLM 真实运行内核,这篇长文值得逐字细读!原文:How LLMs Actually Work,作者 0xkatoTL;DR:这篇文章把基于Transformer架构的大语言模型,完整拆解成九大运行环节,从输入内容到输出结果讲解得一清二楚,分别是分词、嵌入、位置编码、注意力机制、多头注意力、前馈网络、残差流与归一化、下一词预测循环。
枫子有风19 小时前
面试·职场和发展·llm·rag
LLM-RAG(大厂面试常问问题)RAG 是什么?为什么需要 RAG? RAG 的完整链路是怎样的? 向量检索的原理是什么? 向量数据库怎么选?Milvus、FAISS、Qdrant 各自适合什么场景? 纯向量检索有什么问题?为什么需要混合检索? Rerank 是什么?为什么检索之后还要重排序? Chunk 怎么切?切大了切小了各有什么问题? Embedding 模型怎么选?中文场景选什么? RAG 的幻觉怎么处理? RAG 检索效果不好怎么优化? Agentic RAG 是什么?和普通 RAG 有什么区别?
冬奇Lab1 天前
人工智能·llm·agent
Agent 系列(19):Harness 完整体系——8 层防护框架全景第 17 篇介绍了 Harness 的五个要素:动作空间、人工检查点、执行边界、审计日志、回滚。五要素是骨架,能处理大多数场景。
逻极1 天前
架构·llm·agent·rag·多智能体系统·hermes agent·hermes
Hermes Agent深度探索:一个会自我沉淀经验的终端智能体第一次打开 Hermes Agent,很多人会把它归类成“带工具调用的命令行 AI 助手”。这个判断并不算错,但它只描述了最外层的使用体验。真正深入源码之后,你会发现它更像一个面向长期运行的 Agent 运行时——模型只是其中一个组件,工具、会话、记忆、技能、插件、安全策略、多平台入口和状态恢复共同构成了完整系统。
stereohomology2 天前
llm·多模态编辑
让AI精确修改视觉可见的细节是繁琐的还是忍不住想上手怪不得Sora做不下去,Sora的客服处理投诉肯定很累。
AndrewHZ2 天前
人工智能·深度学习·语言模型·开源·llm·transformer·基座模型
【LLM技术全景】开源大模型生态:如何选择适合你的基座模型?摘要:本文是《LLM技术全景:从Token到部署》系列第六篇。随着LLaMA开源引爆生态,现在已有数十个开源大模型可供选择。但"选择困难症"也随之而来:LLaMA、ChatGLM、Qwen、DeepSeek、Mistral……到底哪个更适合我的项目?本期将系统对比主流开源模型的技术特点、中文能力、部署成本,并提供一套"模型选择决策树",帮助开发者在2026年做出最合适的技术选型。
troubles maker2 天前
llm·nlp·llama·多模态
LLaMA-Adapter V2: Parameter-Efficient Visual Instruction Model论文链接:https://arxiv.org/pdf/2304.15010大语言模型(Large Language Model,LLM)的落地应用中,轻量化微调是平衡性能、算力与部署成本的核心技术路线。相较于全参数微调、低秩自适应(Low-rank adaptation,LoRA)[1] 等主流方案,Adapter 架构以模块化、高兼容性的特点,被广泛应用于 LLaMA[2] 等开源大模型的下游迁移任务。
老梁agent2 天前
物联网·llm
一个工程师的 LLM 理论入门:Transformer、Attention 和 Tokenization(不带公式)你不做算法研究,但你写 Agent。理解 LLM 怎么工作,能帮你写出更好的 @Tool 描述、更准的 SystemMessage、更省的 Prompt。
没有腰的嘟嘟嘟2 天前
ai·llm·agent·rag·skill·spring ai·mcp
Easy-agent介绍目前,我的工作主要聚焦于 Agent 和 SKILL 相关领域。随着公司多个项目完成 Agent 化升级,我将项目集成 Agent 架构的经验进行总结和封装,最终开发出一个可复用组件——Easy-agent。
Shawn_Shawn2 天前
后端·llm
Apache Doris Ai Function学习Apache Doris 是一款基于 MPP 架构的高性能、实时分析型数据库。随着大模型与向量检索技术在企业级场景的加速落地,从 Apache Doris 4.0 版本开始,Doris 围绕 "AI 驱动、搜索增强、离线提效" 三大方向进行了重大升级,正式将 AI 能力深度集成到数据库内核。
DigitalOcean2 天前
llm·gpu
微调后的 LLM 如何部署到生产环境?从GPU 推理端点的搭建、测试与上线全流程想象一下这样一个产品团队:他们针对临床病历(Clinical Notes)对一个大语言模型进行了微调。在实验室测试中,提示词和模型生成的回答看起来都棒极了。然而,紧接着有人提出了一个棘手的问题:我们如何在不将受保护健康信息(PHI)暴露给共享公共 API 的前提下,把这个模型安全地接入面向患者的移动应用中?
叫我少年2 天前
llm
DeepSeek V4 Pro + Flash 分工编程:成本骤降 60%+ 的混合模型工作流Pro 和 Flash 到底怎么选?全用 Pro 太贵,全用 Flash 怕质量不行。这篇就来聊聊如何用「Pro 规划 + Flash 执行 + Pro 审查」的混合工作流,在不牺牲代码质量的前提下,把 API 费用砍掉一半以上。
OpenBayes贝式计算2 天前
google·llm·agent
LongCat-Video-Avatar 1.5开源,具备全领域泛化能力的音频驱动视频生成模型;AI Student Impact Dataset 5 万量级多公共资源速递6 个公共数据集:* EAVSD 电商广告视频分镜数据集Movie Feelings 电影情感特征数据集
质造者3 天前
大模型·llm·prompt·测试提升
Prompt工程从入门到进阶!基于通义千问实战零样本/少样本/CoT/攻防防范(附完整代码)很多同学调用大模型 API 时,常会遇到输出混乱、答非所问、风格不可控等问题;同时线上 AI 应用还普遍存在 Prompt 注入、模型越狱 等安全漏洞。 本文基于通义千问 + Streamlit 搭建可视化旅行助手,从零带你上手 5 大主流 Prompt 调优手法,并复现 3 类高危攻击与双层防护方案。全文代码开箱即用,适合 AI 入门、Python 实战、大模型安全方向学习。
星浩AI3 天前
pytorch·深度学习·llm
(七)GPT2中文生成模型定制化微调训练[附源码]上一篇文章完成了 BERT 微调效果的系统测试与验收指标设计。本章进入生成式模型领域:使用 Hugging Face 上的 GPT-2 中文预训练模型,在本地语料上微调,训练一个中文古诗词生成模型。