llm

五点钟科技1 小时前
人工智能·llm·ocr·论文·大语言模型·deepseek·deepseek-ocr
Deepseek-OCR:《DeepSeek-OCR: Contexts Optical Compression》 论文要点解读最近幻方又在搞事情了,一篇关于通过视觉进行语言理解的论文火遍圈子。迫不及待看了看论文,发现他们真是一支十分聪明又十分善于思考的团队,不得不佩服!
AndrewHZ2 小时前
人工智能·算法·语言模型·大模型·llm·ai智能体
【AI黑话日日新】什么是AI智能体?本文将从定义、核心能力、技术架构、与传统AI的区别及应用场景,全面解析AI智能体,帮助开发者与技术爱好者理解这一AI领域的核心演进方向。
山顶夕景7 小时前
llm·agent·多模态
【LLM】多模态智能体Kimi-K2.5模型Kimi K2.5 是 Moonshot AI 发布的开源多模态智能体模型,旨在推动通用智能体智能(General Agentic Intelligence)的发展。该模型采用原生多模态架构,通过文本与视觉的联合优化,以及创新的Agent Swarm(智能体集群)框架,在推理、编程、视觉理解和智能体任务上达到了业界领先水平。
JTnnnnn7 小时前
llm·antv·dify
【架構優化】拒絕 LLM 幻覺:設計基於 Python 路由的 AntV 智慧圖表生成系統在開發 Dify 數據助理過程中,直接將原始數據(如 BigQuery JSON)丟給 LLM 並期望其產出精確的圖表代碼,往往是穩定性的噩夢。 雖然 MCP 提供了便利,但在處理大規模數據或複雜語意時,常會遇到 Token 溢出、數據類型錯誤 或 圖表類型誤判。
AndrewHZ8 小时前
语言模型·大模型·llm·claude code·skills
【AI黑话日日新】什么是skills?Claude Code 中的 Skills 是一套可定制化的扩展机制,本质是将专业知识、任务流程、可执行代码等打包成独立模块,供 Claude 根据上下文自动或手动调用,以完成特定专业任务。以下从核心定义、特性、结构、使用方式等方面详细介绍:
国家一级假勤奋大学生17 小时前
大模型·llm·vlm·mllm·internvl·调研笔记
InternVL系列 technical report 解析论文链接: [2312.14238] InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks
缘友一世1 天前
学习·llm·pp·tp
张量并行和流水线并行原理深入理解与思考MLP 通常由两个线性层组成: A A A 层(升维)和 B B B 层(降维)。第一步:Linear 1 —— 列并行
CoderJia程序员甲1 天前
开源·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-01-30)生成于:2026-01-30共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜显示AI智能体开发依然是绝对焦点,跨平台个人助手、多智能体协作平台和专业化工具链项目表现抢眼。具体趋势体现在三个方面:首先,可定制化个人AI助手(如moltbot、kimi-cli)持续走热,强调全平台兼容和代码驱动。其次,智能体能力边界拓展成为关键,围绕记忆增强(memU)、系统提示词逆向(system_prompts_leaks)和标准化协议(MCP)的创新工具涌现,助力开发者突破大模型固有局限。最后,开源社区正积
亚里随笔1 天前
人工智能·分布式·llm·rl·agentic
MegaFlow:面向Agent时代的大规模分布式编排系统随着交互式和自主AI系统的快速发展,我们正步入Agent时代。在软件工程和计算机使用等复杂任务上训练智能体,不仅需要高效的模型计算能力,更需要能够协调大量Agent-环境交互的复杂基础设施。MegaFlow作为大规模分布式编排系统,为Agent训练工作负载提供高效的调度、资源分配和细粒度任务管理能力,成功实现了数万个并发Agent任务的协调执行,同时保持高系统稳定性和高效的资源利用率。
大熊猫侯佩2 天前
llm·swiftui·大语言模型·foundationmodel·apple ai·apple 人工智能·summarize
赛博深渊(上):用 Apple Foundation Models 提炼“禁忌知识”的求生指南新九龙城的雨从未停过。霓虹灯的废气在湿漉漉的街道上晕染开来,像极了那个死于代码过载的倒霉蛋老王流出的脑浆。
Jack_abu2 天前
llm·机器翻译·ollama·开源翻译模型
谷歌开源翻译模型 TranslateGemma 深度解析与本地部署实践在全球化的商业环境中,跨语言沟通已成为企业数字化转型的核心挑战之一。机器翻译技术作为打破语言壁垒的关键工具,其重要性日益凸显。
CoderJia程序员甲2 天前
git·ai·开源·llm·github
GitHub 热榜项目 - 日榜(2026-01-29)生成于:2026-01-29共发现热门项目: 11 个榜单类型:日榜本期GitHub热榜显示AI智能体工具生态持续火爆,多个项目聚焦于提升AI智能体的实用性与工程化水平。如pi-mono和kimi-cli提供了功能强大的CLI开发工具,Vision-Agents则让视觉智能体开发更便捷。同时,memU致力于解决智能体的长期记忆难题,system_prompts_leaks揭示了主流AI模型的工作原理,反映出开发者对智能体可解释性与深度定制的强烈需求。此外,Vault等底层基础设施项目热度不减,表明在AI应
sg_knight2 天前
windows·macos·llm·ai编程·claude·code·claude-code
Claude Code 安装指南(Windows / macOS)在前面的几篇里,我们已经把 Claude Code 的定位和使用理念讲清楚了。 从这一篇开始,正式进入动手阶段。
AI 菌2 天前
人工智能·算法·语言模型·llm
视觉令牌压缩:Vision-centric Token Compression in Large Language Model随着现实世界应用对大语言模型(LLMs)的需求不断升级,上下文窗口被扩展至数十万token,同时模型参数规模从数十亿激增至万亿级别。这种“长上下文+大模型”的双重扩张导致计算成本和内存消耗飙升,使得token压缩成为LLMs高效处理长文本任务的必备技术。
特立独行的猫a2 天前
ai·大模型·llm·openai
2026国内外主流大模型全景对比:技术演进与场景适配深度解析当 AI 大模型从 “可选工具” 变为 “必备生产力”,“是否使用 AI” 已无需纠结,核心命题转为 “如何精准用对 AI、快速借 AI 提效”。结合前文对 16 款主流模型的多维度对比,无论是企业还是个人,想要跟上时代节奏、实现效率跃迁,需遵循 “认知先行、场景落地、长期迭代” 的三步走逻辑
vanilla阿草2 天前
llm
Moltbot的安装踩坑与初体验本文介绍了安装和配置moltbot时踩过的一些坑,并提供了Moltbot接入百炼API的方法和使用飞书与Moltbot交互的方法
nuowenyadelunwen3 天前
llm·bpe tokenizer·stanford cs336
Stanford CS336 Assignment 1: BPE Tokenizer问题:计算机只认识数字,但我们要处理文本解决方案:Tokenizer 就是这个转换器Unicode 是什么?
农场主John3 天前
pytorch·llm·deepspeed
Accelerate_deepspeed使用执行完accelerate config会有一个默认的yaml配置文件
组合缺一3 天前
java·人工智能·分布式·llm·mcp·skills
论 AI Skills 分布式发展的必然性:从单体智能到“云端大脑”的跃迁在人工智能从“对话式模型”向“原生智能体(Agentic AI)”进化的进程中,我们正处于一个类似于互联网从单机软件向分布式架构转型的关键拐点。这一转型的核心,在于 AI Skills 的崛起及其分布式发展的必然。
小哈里3 天前
人工智能·大模型·llm·分布式计算·ray
【计算】Ray框架介绍,AI基础设施之“通用”分布式计算(跨场景,门槛低,大规模生产,单机->集群->推理一站式)【计算】Ray框架介绍,AI基础设施之“通用”分布式计算(跨场景,门槛低,大规模生产,单机->集群->推理一站式)