ai

张忠琳32 分钟前
ai·架构·vllm
【vllm】vLLM v1 Executor — 系统级架构深度分析(五)分析范围:vllm/v1/executor/ 目录,8个Python文件,~3.5K行代码。 Executor 是 v1 推理系统的"执行引擎"——连接调度器与 Worker,负责模型推理的多 GPU / 多节点编排。
MY_TEUCK38 分钟前
人工智能·spring boot·ai·云原生·aigc
从零开始:使用Sealos Devbox快速搭建云原生开发环境在云原生时代,开发环境的配置往往成为开发者的痛点。传统的本地开发环境搭建需要安装各种依赖、配置数据库、设置网络等,这些繁琐的操作不仅耗时,还容易导致"在我机器上能跑"的问题。今天,我将为大家介绍一款革命性的云开发平台——Sealos Devbox,它能让开发者专注于代码编写,而将环境配置交给云端处理。
深念Y1 小时前
ai·api·agent·开发·token·工程·词元
Token 还没白菜价,我靠“AI 流水线”省token我的 HomeSense 项目,参考了三十多个开源项目。从工作流编排的 Dify,到工具注册的 AgentMesh;从多 Agent 联邦的 OpenClaw,到记忆系统的 MemPalace;从手机自动化的 Gkd、UI-TARS,到设备接入的 python-miio、ha-xiaomi-home。
~kiss~1 小时前
ai
GPT-6 的 Tool Searchˈrevənjuː (企业、组织的)收入,收益;(政府的)税收;税务局,税务署(the revenue)
有才不一定有德10 小时前
ai·claude
价格不变,账单变厚?深度拆解 Claude Opus 4.7 的“隐形”进化就在本周,Anthropic 毫无预兆地发布了其顶奢模型系列的最新迭代——Claude Opus 4.7。作为 AI 圈公认的“智商天花板”,Opus 的每次更新都牵动着开发者的神经。但这次更新引发的讨论却非常耐人寻味:一方面是性能的暴力提升,另一方面却是社区对“新分词器”带来的隐形成本的集体吐槽。
Old Uncle Tom10 小时前
人工智能·ai·agent
Claude Code 记忆系统分析2根据 src/memdir/memoryTypes.ts,记忆系统被限制为四种类型,用于捕获无法从当前项目状态推导的上下文信息。
wenha11 小时前
ai
大模型基础(二):必懂5大基础概念《Token、上下文窗口、Embedding、预训练、微调》本文承接上篇《什么是LLM》,用最通俗、最直白的方式,把大模型最核心的5个技术概念一次性讲透。看完这篇,你再读任何大模型文章、文档、论文都不会再懵。
小安同学iter11 小时前
ai·langchain·agent·langchain4j·java+ai
LangChain4j:非 Spring 系,AI For Java的另一条路目录一 技术实现:0 依赖管理1 AI代理调用2 向量模型3 向量数据库4 记忆存储5 流式聊天大模型
维元码簿11 小时前
ai·agent·claude code·ai coding
系列开篇 | Claude Code 源码架构概览:51万行代码的模块地图Hi,大家好,欢迎来到维元码簿。这是一个关于 Claude Code 源码学习的系列。Claude Code 是当前业界 Coding Agent 的 SOTA 实现。能接触到这样一个工业级系统的完整源码,是难得的学习机会。所以我决定用 Coding Agent 帮我读懂 Claude Code,同时把这个学习过程完整记录下来。
庄小焱11 小时前
人工智能·ai·向量数据库·ai大模型·rag·rag索引·索引构建与优化
【AI模型】——RAG索引构建与优化本文系统介绍了RAG(检索增强生成)系统中的索引构建与优化技术。核心内容包括:向量嵌入(Embedding)的原理、发展历程及选型方法;多模态嵌入技术(以CLIP和bge-visualized-m3为例);向量数据库(FAISS、Milvus等)的工作机制与实战应用;以及两种关键索引优化策略——上下文扩展优化(句子窗口检索)和结构化索引优化。文章还探讨了LLM知识时效性、模型更新机制及框架选择等延伸问题,为构建生产级RAG系统提供完整技术指南。
呆呆敲代码的小Y11 小时前
人工智能·ai·llm·agent·优化·skill·mcp
从LLM到Agent Skill:AI核心技术全拆解与系统化学习路线完整拆解从底层大模型到任务定制的全链路关键步骤,并给出分阶段可落地的学习路线,同时适配作为开发者的场景做定制化优化。
俊哥V11 小时前
人工智能·ai
每日 AI 研究简报 · 2026-04-18(本文借助 AI 大模型及工具辅助整理)一句话总结:Anthropic 强势扩张产品线,Claude Design 挑战 Figma;OpenAI 高管离职潮持续;AI Agent 从实验室走向企业基础设施,军事 AI 合规边界正在被重新划定。
拾薪13 小时前
网络·人工智能·ai·架构·superpower·brainstorming
[SuperPower] Brainingstorm - 流程控制架构分析brainstorming技能通过三个相互关联的章节构建了完整的流程控制架构:这三个章节构成了一个三层架构的质量保证体系。
胡志辉的博客14 小时前
人工智能·设计模式·ai·agent·中介者模式·openclaw·herman
多智能体协作,不是多开几个 Agent:从中介者模式看 OpenClaw 和 Hermes Agent这次我想把话再往前推一步。多智能体不是 AI 突然发明出来的一种“新组织学”。它更像是软件行业过去二十年已经反复踩过的几类协调问题,在 LLM 时代重新回来了一遍。只不过这次,系统里多了一个会推理、会犯错、会临场改主意的执行单元。所以真正值得看的,从来不是“一个 agent 写代码,另一个 agent 做测试”这种角色分工。而是下面这几个更硬的问题:- 谁负责拆任务- 谁负责分配权限和预算- 谁决定上下文该给到哪一层- 子任务失败以后,系统怎么重试、降级、终止这也是我最近把 OpenClaw 和 Herm
庄小焱17 小时前
ai·rag·ai模型·rag检索优化
【AI模型】——RAG检索优化混合检索(Hybrid Search)是一种结合了稀疏向量(Sparse Vectors) 和 密集向量(Dense Vectors) 优势的先进搜索技术。旨在同时利用稀疏向量的关键词精确匹配能力和密集向量的语义理解能力,以克服单一向量检索的局限性,从而在各种搜索场景下提供更准确、更鲁棒的检索结果。
北灵聊AI17 小时前
ai
Claude Opus 4.7 实测:对比 GPT-5.4Anthropic 昨天发布了 Claude Opus 4.7。我也在深夜爆肝实测了一轮。这篇文章给大家介绍一下Claude Opus 4.7相比上一代Claude Opus 4.6有哪些变化、评分怎么样、以及和GPT-5.4的对比。
大棉花哥哥18 小时前
macos·ai
MAC下JADX+MCP+OpenCode自动APK逆向分析本文档介绍如何在 macOS 上配置 JADX 反编译工具与 OpenCode 的 MCP 连接,实现 APK 分析。
G_G#18 小时前
ai·claude·千问·claude code
claude code配置千问APIKeyClaude Code 本身是 Anthropic 官方的 CLI 工具,不直接支持填入通义千问(Qwen)的 Key,但可以通过 阿里云百炼(Model Studio)的 Anthropic 兼容接口 来 “借壳” 使用千问。 下面给你 Windows /macOS/ Linux 通用、可直接复制的完整配置。 一、先获取通义千问 API Key(百炼) 登录 阿里云百炼: https://bailian.console.aliyun.com/ 进入 API Key 管理 → 创建 API Key 复制得
健康人猿19 小时前
学习·ai·grok·马斯克·xai·supergrok
Grok 4.3 Beta | xAI用300美刀告诉你,AI终于可以交作业了就昨天,xAI 连官宣都没发,直接把 Grok 4.3 Beta 扔到了 grok.com 的模型选择器里,标签就俩字:Early Access。现在是早期测试版,会在修复漏洞和添加功能时发布发布说明