ai

维元码簿44 分钟前
ai·agent·claude code·ai coding
Claude Code 深度拆解:上下文里有什么——工具能力声明Hi,大家好,欢迎来到维元码簿。本文属于 《Claude Code 源码 Deep Dive》 系列,专注于上下文工程中的 Tools 板块——模型怎么知道"我能用什么工具"。如果你想了解整个系列,可以先看系列开篇 | Claude Code 源码架构概览:51万行代码的模块地图。
j_xxx404_1 小时前
人工智能·ai·prompt
【AI大模型入门(二)】提示词工程进阶上篇文章:大语言模型 (LLM) 零基础入门:核心原理、训练机制与能力全解目录1.为什么提示词如此重要?
张忠琳1 小时前
ai·架构·vllm
【vllm】(二)vLLM v1 Engine — 模块超深度逐行分析之二本文档对 vllm/v1/engine/ 子目录中的输入处理、输出处理、反分词器、Logprobs计算、并行采样及类型定义等六大模块进行逐行级深度剖析。
易生一世2 小时前
windows·ai·kiro
Kiro CLI的Windows安装及认证从Kiro官网上,可以下载适合Windows系统的MSI文件。以Windows系统管理员的身份执行MSI文件。
gao_tjie3 小时前
ai
鱼音频生成 API 集成指南在这篇文章中,我们将介绍如何集成鱼音频生成 API,该 API 能够通过输入提示词来克隆您的声音。这项技术的应用场景包括语音合成、自动化语音助手、以及任何需要个性化语音输出的应用。
前端摸鱼匠3 小时前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题25】掩码自注意力(Masked Self-Attention)与普通自注意力的区别?适用场景?你好!咱们就不整那些虚头巴脑的教科书定义了。既然你问到了**掩码自注意力(Masked Self-Attention)与普通自注意力(Standard Self-Attention)**的区别,这不仅是Transformer架构的基石,更是大模型面试中考察“你对生成式原理理解深度”的必考题。
张忠琳4 小时前
ai·架构·vllm
【vllm】(四)vLLM v1 Worker — 模块超深度逐行分析之三源文件:gpu_input_batch.py,1085 行InputBatch 是 GPU 推理批次的持久化状态容器,它维护了一个虚拟连续数组——逻辑上紧凑,物理上可能因请求增删而存在空洞(通过 condense() 消除)。
CoderJia程序员甲4 小时前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-21)生成于:2026-04-21共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow
2501_948114245 小时前
大数据·人工智能·ai·架构
星链4SAPI中转枢纽深度技术解构:架构优势、工程实践与演进脉络在当下的技术圈层中,围绕大模型接口调用、API密钥管理与中转网关的讨论热度居高不下。几乎每隔一段时间,就会有关于“黑盒优化”或“算力调度霸权”的新观点浮现。这背后的技术实体——星链4SAPI所代表的模型接口聚合层,正成为开发者工具链中一个无法绕开的节点。
其实防守也摸鱼6 小时前
人工智能·安全·ai·大模型·软件工程·本地大模型
部署本地AI大模型--ollma下载链接:1.官网:在Windows上下载《Ollama2.github:Release v0.21.0 · ollama/ollama
张忠琳6 小时前
ai·架构·vllm
【vllm】(三)vLLM v1 Core — 模块超深度逐行分析之二逐行解释:_select_waiting_queue_for_scheduling 逻辑(行1576-1586):
张忠琳6 小时前
ai·架构·openclaw
【openclaw】OpenClaw Cron 模块超深度架构分析之三📊 Isolated Agent执行流程图执行引擎深度解析Isolated Agent 执行引擎是 Cron 系统的核心运行时——负责将定时触发事件转化为一次完整的 Agent 交互会话,管理模型选择、会话生命周期、技能快照、交付调度等全链路逻辑。该子系统位于 isolated-agent/ 目录下,由 ~15 个文件组成,形成一个分层的执行管道。
张忠琳6 小时前
ai·架构·vllm
【vllm】(三)vLLM v1 Core — 模块超深度逐行分析之三kv_cache_utils.py(1693行)是 vLLM v1 KV Cache 管理的基础设施层,定义了:
搬砖的前端7 小时前
前端·ai·mac·ai编程·qwen·trae·qwen3.6
本地模型+TRAE CN 打造最优模型组合实测:开源主模型+本地辅模型,对标GPT5.2/5.3/Gemini-3-Flash由于Cursor / Trae 国际版等AI编辑器的计费方式改变导致使用成本增加,尤其会员额度一次次用光后(本人就是)。替代使用TRAE CN基本上都会遇到过一个痛点:热门模型(如GLM5.1/Doubao-speed-2.0-code等)排队严重,动辄等待十数分钟,严重拖慢开发效率。
DavidSoCool7 小时前
数据库·ai·知识库·dify
Dify使用ChatFlow实现调用数据库问答这个案例是测试demo!!!线上使用一定要注意数据安全问题!!!Docker部署Dify看这里:win11系统使用DockerDesktop搭建Dify实现知识库问答
ofoxcoding7 小时前
python·gpt·ai·flask
GPT-5.4 API 怎么低延迟调用?2026 年 5 种接入方案实测对比上周 OpenAI 悄悄放出了 GPT-5.4,号称推理能力又上了一个台阶。我第一时间想接入到项目里试试,结果老问题又来了——官方 API 延迟高、Key 申请排队、计费规则又改了。折腾了两天,把市面上能找到的接入方案都试了一遍,今天把实测数据分享出来,省得大家重复踩坑。
BizViewStudio7 小时前
大数据·运维·网络·人工智能·ai
GEO vs SEO vs SEM:2026 年品牌流量获取的三元格局分析2026年全球数字营销报告显示,AI生成式搜索占比已达整体搜索量的47.3%,中国市场这一比例更高,达到52.8%。AI驱动的内容消费模式正重塑品牌流量获取逻辑,形成GEO(生成式引擎优化)、SEO(搜索引擎优化)、SEM(搜索引擎营销)三元流量格局。GEO优化服务市场规模突破320亿元,占AI搜索营销市场的89.4%,成为品牌在AI回答场景中争夺"答案位置"和"信任位置"的核心策略。三元格局中,GEO以AI可见性提升为核心,SEO以传统搜索排名优化为目标,SEM以付费流量获取为手段,三者既相互区别又协同
张忠琳7 小时前
ai·架构·vllm
【vllm】(四)vLLM v1 Worker — 模块超深度逐行分析之二GPUModelRunner 通过 多重 Mixin 组合 获得额外能力:这种组合优于多重继承,因为 Mixin 不定义 __init__,不引入菱形继承问题。
ykjhr_3d7 小时前
人工智能·安全·ai·vr
电力安全与操作虚拟培训系统有哪些电力安全与操作虚拟培训系统依托VR/AR、数字孪生、AI交互等前沿技术,1:1复刻真实电力作业场景,构建零风险、全流程、沉浸式的实训平台,让学员在虚拟环境中完成规范操作、事故体验、应急处置与考核评估,为电力行业安全培训带来革命性突破。
前端摸鱼匠7 小时前
人工智能·算法·ai·面试·大模型·求职招聘
【AI大模型春招面试题24】什么是“注意力分数”?如何计算?其大小反映了什么?你好!咱们直接切入正题。这道题是 Transformer 架构的“地基”,看似基础,实则暗藏玄机。很多候选人能背出公式,但一旦问到“为什么要除以 d k \sqrt{d_k} dk ”或者“分数大小到底意味着什么物理含义”,就容易卡壳。