ai

张忠琳4 小时前
ai·架构·vllm
【vllm】vLLM v1 KV Offload — 模块超深度逐行分析之一(七)分析对象:vllm/vllm/v1/kv_offload 代码规模:16 Python 文件(含4个空__init__.py),1,888 行有效代码
j_xxx404_5 小时前
人工智能·ai·transformer
大语言模型 (LLM) 零基础入门:核心原理、训练机制与能力全解上篇文章:面试官灵魂拷问:Linux软链接与硬链接到底有什么区别?(附底层Inode级深度图解)下篇文章:【AI大模型入门(二)】提示词工程进阶
汪汪8888885 小时前
ai
测试智能平台落地实践:五大核心能力破解传统测试痛点当前软件产品迭代节奏不断加快,传统测试模式的短板愈发突出:PRD落地衔接断层、测试用例设计耗时且覆盖不全、性能脚本编写门槛高、UI迭代导致回归脚本频繁失效、生产故障只能被动“救火”。
张忠琳6 小时前
ai·架构·vllm
【vllm】vLLM v1 Attention — 系统级架构深度分析(五)分析范围:vllm/v1/attention/ 目录,53个Python文件,~25.8K行代码。 Attention 是 v1 推理系统的"计算核心"——所有 GPU 上实际发生的 Attention 计算都由本模块驱动。
薛定谔的猫3697 小时前
ai·自动化·agent·技术趋势·mcp
探索 MCP 协议:构建跨平台的 Agent 自动化生态随着大语言模型(LLM)能力的飞速提升,如何让 Agent 拥有稳定、安全且标准化的外部工具调用能力(Tool Use)成为了当前 AI 领域的核心课题。本文将重点介绍 Model Context Protocol (MCP) 的设计理念,并展示如何利用它实现一个完整的“撰写-发布-通知”自动化闭环。
DavidSoCool7 小时前
ai·大模型·知识库·dify
win11系统使用DockerDesktop搭建Dify实现知识库问答一、安装Docker安装Dify1、安装docker,最好win11系统,不然会有很多错误,然后改下镜像源拉取速度会快点,还有镜像的存储位置防止C盘爆满。
刘大猫.9 小时前
华为·ai·大模型·算力·deepseek·deepseek-v4·昇腾芯片
华为昇腾芯片将为DeepSeek-V4推理,通往国产算力自由V4的推理将运行在950 PR上,其异构计算架构CANN Next将兼容CUDA。不过,V4的训练仍然使用英伟达先进的GPU。
零安道长9 小时前
ai
Twitter 用户信息 API 集成指南在这篇文章中,我们将介绍如何集成 Twitter 用户信息 API。利用这个 API,您可以获取 Twitter 用户的详细信息。只需输入 Twitter 用户的用户名,就能够输出该用户的 Twitter 主页信息。
阿杰学AI10 小时前
数据库·人工智能·ai·语言模型·自然语言处理·向量数据库·vector database
AI核心知识129—大语言模型之 向量数据库(简洁且通俗易懂版)向量数据库 (Vector Database) 是 AI 时代的“超级雷达” ,也是大模型和智能体 (Agent) 真正的“海马体” (人类大脑中负责长期记忆的区域)。
嵌入式小企鹅12 小时前
人工智能·学习·ai·嵌入式·算力·risc-v·半导体
国产大模型与芯片加速融合,RISC-V生态多点开花,AI编程工具迈入自动化新纪元目录🔮 周末核心观察🧠 一、AI芯片 × 半导体涨价🖥️ 二、RISC-V × 嵌入式🤖 三、AI编程 × Agent生态
醇氧12 小时前
人工智能·python·学习·阿里云·ai·云计算
Hermes Agent 学习(安装部署详细教程)Hermes Agent 是 Nous Research 于 2026 年 2 月发布的开源、自托管、会自我进化的 AI 智能体框架。它的核心是学习闭环与持久记忆,让 AI 能像人一样越用越聪明,而非每次对话都从零开始。
图图玩ai12 小时前
linux·nginx·docker·ai·程序员·ssh·可视化·gmssh·批量命令执行
SSH 命令管理工具怎么选?从命令收藏到批量执行一次讲清如果你的工作还停留在“登录服务器、翻历史记录、复制旧命令、再手动粘贴到另一台机器”,那你缺的往往不是更多命令,而是一套更完整的 SSH 命令管理方式。
张忠琳12 小时前
ai·架构·vllm
【openclaw】OpenClaw Flows 模块超深度架构分析分析版本:2026-04-20 | 代码目录:src/flows/ | 风格:Dark Terminal | 源码行数:2,430 行(9 文件,不含测试)
哥布林学者13 小时前
机器学习·ai
深度学习进阶(十) RoI Align在上一篇中,我们已经明确指出:RoI Pooling 的核心问题并不在于 Pooling 本身,而在于“取整导致的量化误差”。
阿杰学AI13 小时前
人工智能·ai·语言模型·自然语言处理·agent·智能体·自主智能体
AI核心知识131—大语言模型之 自主智能体(简洁且通俗易懂版)自主智能体 (Autonomous Agent) 是目前 AI 发展路线图上最耀眼的明珠,也是通往 AGI(通用人工智能)的必经之路。
AIwenIPgeolocation13 小时前
ai
豫见OpenClaw·人工智能技术交流沙龙成功举办 埃文科技受邀主讲共探数智新路径2026年4月15日,由河南省人工智能协会指导,华为技术有限公司主办的豫见OpenClaw·人工智能技术交流沙龙在河南郑州成功举办。论坛邀请河南省行业专家、企业代表与技术领军者齐聚一堂,共话 OpenClaw 技术演进与产业应用新路径,从“可用”到“好用”的实践经验,共探中原地区数智化发展新机遇,助力河南在 AI 新赛道上抓住机遇、加速崛起。埃文科技作为主讲嘉宾受邀出席,并分享核心技术实践。
刘 大 望14 小时前
java·人工智能·后端·spring·机器学习·ai·aigc
RAG相关技术介绍及Spring AI中使用--第三期上一期介绍了RAG系统中的关键ETL(提取、转换、加载)流程中的提取,重点讲解SpringAI框架中的文档读取器实现。ETL过程包括从各类数据源提取内容、进行文本清洗和标准化处理,最后加载到向量数据库。文章详细演示了SpringAI提供的多种DocumentReader实现,包括处理JSON、纯文本、HTML、Markdown、PDF以及各类办公文档的读取器,并展示了MySQL数据库读取器的使用示例。这些工具为构建RAG系统提供了高效的数据预处理能力,确保原始数据能有效转化为适合AI模型检索结构化格式 本
阿杰学AI14 小时前
人工智能·ai·语言模型·自然语言处理·aigc·ai for science·ai4s
AI核心知识132—大语言模型之 AI for Science(简洁且通俗易懂版)AI for Science (人工智能驱动科学研究,简称 AI4S) 是目前整个人工智能领域最硬核、最具有人类历史意义的革命。
后端AI实验室14 小时前
java·ai
我用AI把一个外包需求从30天压到5天交付,然后客户说:下次还找你去年年底,一个朋友介绍了一个单子。某制造业公司,100多人,想做一个员工报销审批系统。需求不复杂:移动端提交报销单,PC端多级审批,财务对账导出。
GJGCY15 小时前
人工智能·安全·ai·rpa·智能体
2026企业RPA+AI智能体落地技术全景:四阶段演进与关键架构决策过去两年,国内企业对RPA+AI智能体的热情从尝鲜迅速转向求实,大模型的爆发让大家看到AI懂业务的潜力,但真正把智能体嵌入核心流程、实现日均数万任务稳定运行的案例仍是少数。麦肯锡2025年调研显示,已有62%的组织开展AI智能体实践,其中高绩效企业EBIT贡献超过5%;Gartner预测,到2026年超过80%的企业将在生产环境部署生成式AI;而IDC则指出,届时40%的工作岗位将与AI智能体协同,传统岗位定义将被重塑。