llm

一个处女座的程序猿1 小时前
llm·ocr·cv·vlm
CV之VLM之LLM-OCR:《DeepSeek-OCR 2: Visual Causal Flow》翻译与解读CV之VLM之LLM-OCR:《DeepSeek-OCR 2: Visual Causal Flow》翻译与解读
dawdo2229 小时前
缓存·llm·transformer·qwen·kv cache
自己动手从头开始编写LLM推理引擎(9)-KV缓存实现和优化在大语言模型的推理过程中,生成每个token都需要计算之前所有token的注意力权重。如果不使用缓存,每次生成都需要重新计算所有历史token的Key和Value,这会导致巨大的计算开销。KV缓存(Key-Value Cache)技术通过缓存历史token的K和V,在后续生成中只计算新token的K和V,从而大幅提升推理性能。
小杨互联网1 天前
llm
LLM应用三大隐形风险与防护方案详解构建一个聊天机器人原型只需几小时,但要安全部署到生产环境,则需要数周的安全规划。传统软件安全关注服务器攻击和密码泄露,而大型语言模型(LLM)应用引入了一类全新的威胁——这些威胁隐藏在AI逻辑本身中悄悄运作。
小汤圆不甜不要钱1 天前
python·llm·rag
「Datawhale」RAG技术全栈指南 Task 5这个项目挺有意思,基于 GitHub 上的「程序员做饭指南」搭建一个智能食谱问答系统。目标很接地气——解决每天"今天吃什么"的世纪难题。数据是 300 多个 Markdown 格式的菜谱文件,结构统一,非常适合做 RAG。
五点钟科技1 天前
人工智能·llm·ocr·论文·大语言模型·deepseek·deepseek-ocr
Deepseek-OCR:《DeepSeek-OCR: Contexts Optical Compression》 论文要点解读最近幻方又在搞事情了,一篇关于通过视觉进行语言理解的论文火遍圈子。迫不及待看了看论文,发现他们真是一支十分聪明又十分善于思考的团队,不得不佩服!
AndrewHZ1 天前
人工智能·算法·语言模型·大模型·llm·ai智能体
【AI黑话日日新】什么是AI智能体?本文将从定义、核心能力、技术架构、与传统AI的区别及应用场景,全面解析AI智能体,帮助开发者与技术爱好者理解这一AI领域的核心演进方向。
山顶夕景1 天前
llm·agent·多模态
【LLM】多模态智能体Kimi-K2.5模型Kimi K2.5 是 Moonshot AI 发布的开源多模态智能体模型,旨在推动通用智能体智能(General Agentic Intelligence)的发展。该模型采用原生多模态架构,通过文本与视觉的联合优化,以及创新的Agent Swarm(智能体集群)框架,在推理、编程、视觉理解和智能体任务上达到了业界领先水平。
JTnnnnn1 天前
llm·antv·dify
【架構優化】拒絕 LLM 幻覺:設計基於 Python 路由的 AntV 智慧圖表生成系統在開發 Dify 數據助理過程中,直接將原始數據(如 BigQuery JSON)丟給 LLM 並期望其產出精確的圖表代碼,往往是穩定性的噩夢。 雖然 MCP 提供了便利,但在處理大規模數據或複雜語意時,常會遇到 Token 溢出、數據類型錯誤 或 圖表類型誤判。
AndrewHZ1 天前
语言模型·大模型·llm·claude code·skills
【AI黑话日日新】什么是skills?Claude Code 中的 Skills 是一套可定制化的扩展机制,本质是将专业知识、任务流程、可执行代码等打包成独立模块,供 Claude 根据上下文自动或手动调用,以完成特定专业任务。以下从核心定义、特性、结构、使用方式等方面详细介绍:
国家一级假勤奋大学生2 天前
大模型·llm·vlm·mllm·internvl·调研笔记
InternVL系列 technical report 解析论文链接: [2312.14238] InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks
缘友一世2 天前
学习·llm·pp·tp
张量并行和流水线并行原理深入理解与思考MLP 通常由两个线性层组成: A A A 层(升维)和 B B B 层(降维)。第一步:Linear 1 —— 列并行
CoderJia程序员甲2 天前
开源·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-01-30)生成于:2026-01-30共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜显示AI智能体开发依然是绝对焦点,跨平台个人助手、多智能体协作平台和专业化工具链项目表现抢眼。具体趋势体现在三个方面:首先,可定制化个人AI助手(如moltbot、kimi-cli)持续走热,强调全平台兼容和代码驱动。其次,智能体能力边界拓展成为关键,围绕记忆增强(memU)、系统提示词逆向(system_prompts_leaks)和标准化协议(MCP)的创新工具涌现,助力开发者突破大模型固有局限。最后,开源社区正积
亚里随笔2 天前
人工智能·分布式·llm·rl·agentic
MegaFlow:面向Agent时代的大规模分布式编排系统随着交互式和自主AI系统的快速发展,我们正步入Agent时代。在软件工程和计算机使用等复杂任务上训练智能体,不仅需要高效的模型计算能力,更需要能够协调大量Agent-环境交互的复杂基础设施。MegaFlow作为大规模分布式编排系统,为Agent训练工作负载提供高效的调度、资源分配和细粒度任务管理能力,成功实现了数万个并发Agent任务的协调执行,同时保持高系统稳定性和高效的资源利用率。
大熊猫侯佩3 天前
llm·swiftui·大语言模型·foundationmodel·apple ai·apple 人工智能·summarize
赛博深渊(上):用 Apple Foundation Models 提炼“禁忌知识”的求生指南新九龙城的雨从未停过。霓虹灯的废气在湿漉漉的街道上晕染开来,像极了那个死于代码过载的倒霉蛋老王流出的脑浆。
Jack_abu3 天前
llm·机器翻译·ollama·开源翻译模型
谷歌开源翻译模型 TranslateGemma 深度解析与本地部署实践在全球化的商业环境中,跨语言沟通已成为企业数字化转型的核心挑战之一。机器翻译技术作为打破语言壁垒的关键工具,其重要性日益凸显。
CoderJia程序员甲3 天前
git·ai·开源·llm·github
GitHub 热榜项目 - 日榜(2026-01-29)生成于:2026-01-29共发现热门项目: 11 个榜单类型:日榜本期GitHub热榜显示AI智能体工具生态持续火爆,多个项目聚焦于提升AI智能体的实用性与工程化水平。如pi-mono和kimi-cli提供了功能强大的CLI开发工具,Vision-Agents则让视觉智能体开发更便捷。同时,memU致力于解决智能体的长期记忆难题,system_prompts_leaks揭示了主流AI模型的工作原理,反映出开发者对智能体可解释性与深度定制的强烈需求。此外,Vault等底层基础设施项目热度不减,表明在AI应
sg_knight3 天前
windows·macos·llm·ai编程·claude·code·claude-code
Claude Code 安装指南(Windows / macOS)在前面的几篇里,我们已经把 Claude Code 的定位和使用理念讲清楚了。 从这一篇开始,正式进入动手阶段。
AI 菌3 天前
人工智能·算法·语言模型·llm
视觉令牌压缩:Vision-centric Token Compression in Large Language Model随着现实世界应用对大语言模型(LLMs)的需求不断升级,上下文窗口被扩展至数十万token,同时模型参数规模从数十亿激增至万亿级别。这种“长上下文+大模型”的双重扩张导致计算成本和内存消耗飙升,使得token压缩成为LLMs高效处理长文本任务的必备技术。
特立独行的猫a4 天前
ai·大模型·llm·openai
2026国内外主流大模型全景对比:技术演进与场景适配深度解析当 AI 大模型从 “可选工具” 变为 “必备生产力”,“是否使用 AI” 已无需纠结,核心命题转为 “如何精准用对 AI、快速借 AI 提效”。结合前文对 16 款主流模型的多维度对比,无论是企业还是个人,想要跟上时代节奏、实现效率跃迁,需遵循 “认知先行、场景落地、长期迭代” 的三步走逻辑
vanilla阿草4 天前
llm
Moltbot的安装踩坑与初体验本文介绍了安装和配置moltbot时踩过的一些坑,并提供了Moltbot接入百炼API的方法和使用飞书与Moltbot交互的方法