运维

ghostwritten几秒前
运维·云原生·kubernetes
春节前夕,运维的「年关」:用 Kubeowler 给集群做一次「年终体检」别人过年贴春联,运维过年贴巡检报告。—— 鲁迅没说过,但很有道理。先吹为敬。这整坨东西——Kubeowler,一个用 Rust 写的 Kubernetes 集群巡检工具,多维度检查、权重打分、多格式报告、按资源分组、还带可选的节点级 DaemonSet——是笔者在不到一周里从零撸出来的。而且有个小前提:当时我对 Rust 一窍不通。fn 和 impl 都认不全,ownership、生命周期、borrow checker 更是「听说过,没见过」。那怎么搞?完全 Cursor AI,我负责想清楚「要查啥、报告
馨谙18 分钟前
运维·ansible
Ansible模块化Playbook管理:静态导入与动态包含详解目录前言:一、核心概念:静态 vs 动态1.1 静态导入(Import)1.2 动态包含(Include)
聆风吟º5 小时前
运维·开源·自动化·cann
CANN开源项目深度实践:基于amct-toolkit实现自动化模型量化与精度保障策略在当前AI模型日益复杂、应用场景不断扩展的背景下,模型推理的效率与性能优化变得至关重要。CANN(Compute Architecture for Neural Networks)作为华为针对AI场景推出的异构计算架构,在这一领域扮演着关键角色。通过对CANN开源项目仓库的解读,我们发现其生态中包含了丰富的算子库和工具集,为AI模型在不同硬件上的高效部署提供了坚实支持。
较劲男子汉8 小时前
运维·服务器·数据库·cann
CANN Runtime零拷贝传输技术源码实战 彻底打通Host与Device的数据传输壁垒在我们折腾AI模型加速的时候,往往把目光聚焦在算子优化、模型压缩上,却偏偏忽略了一个看似简单却极易成为性能瓶颈的环节——数据在Host(CPU)和Device(NPU)之间的搬运。今天,咱们就深入CANN的ops-nn仓库,扒一扒Runtime里零拷贝(Zero-Copy) 传输技术的实现老底,看看华为的大佬们是如何用共享内存和内存映射这些“老手艺”来玩出花样的,实现数据传输的“静默无声”与“极致速度”。
风流倜傥唐伯虎9 小时前
java·运维·spring boot
Spring Boot Jar包生产级启停脚本
Doro再努力9 小时前
android·linux·运维·服务器·编辑器·vim
【Linux操作系统10】Makefile深度解析:从依赖推导到有效编译🎯 导语:作为一名程序员,你是否曾经疑惑过——为什么第一次make能编译成功,第二次却提示"已经是最新的"?为什么make clean每次都能执行?今天,我将带你深入Makefile的内部机制,彻底搞懂依赖推导、伪目标、ACM时间这些核心概念。
senijusene9 小时前
linux·运维·服务器
Linux软件编程:IO编程,标准IO(1)在Linux系统中,所有输入输出操作都统一为文件操作,具体分为以下几类:核心思想:无论操作什么类型的"文件",都使用相似的IO接口。
忧郁的橙子.9 小时前
linux·运维·服务器
02-本地部署Ollama、Python黑马程序员学习笔记在命令窗口中打开安装包所在文件夹(WSL和win11共用文件目录)回到虚拟机目录cd ~
醇氧9 小时前
linux·运维·服务器
【linux】查看发行版信息Linux 主流发行版本CentOS版本的区别显示简略信息:Debian/Ubuntu:Red Hat/CentOS/Fedora:
No8g攻城狮10 小时前
linux·运维·ubuntu
【Linux】Windows11 安装 WSL2 并运行 Ubuntu 22.04 详细操作步骤博主介绍:✌全网粉丝24W+,CSDN博客专家、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域✌
酷酷的崽79810 小时前
运维·人工智能
CANN 生态可维护性与可观测性:构建生产级边缘 AI 系统的运维体系cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn 在完成性能优化与安全加固后,一个边缘 AI 系统仍面临最后一道关卡:长期运行中的可维护性与可观测性。工业现场往往地处偏远、无人值守,一旦系统异常(如模型漂移、硬件老化、网络中断),若缺乏有效的监控与自愈机制,将导致服务长时间中断,造成业务损失。
做人不要太理性10 小时前
android·运维·魔珐星云
CANN Runtime 运行时组件深度解析:任务调度机制、存储管理策略与维测体系构建逻辑在异构计算软件栈中,运行时(Runtime)组件处于承上启下的关键位置。它向下衔接驱动程序(Driver),直接操作昇腾 AI 处理器的底层资源;向上承接图引擎(GE)生成的执行计划,将逻辑上的计算图转化为物理硬件上的任务序列。runtime 仓库提供的组件负责管理算子的加载、内存的动态分配、任务的分发调度以及系统级的维度观测与性能测量。
souyuanzhanvip10 小时前
linux·运维·服务器
ServerBox v1.0.1316 跨平台 Linux 服务器管理工具ServerBox v1.0.1316 是一款开源免费的 Linux 服务器管理工具,基于 Flutter 框架开发,全面支持 iOS、Android、macOS、Windows 及 Linux 五大主流系统,集成实时监控、SSH 连接、文件传输等核心功能,为服务器管理员与开发者提供高效稳定的一站式管控方案,是跨平台服务器管理的优选工具。
文静小土豆10 小时前
运维·docker·容器
Docker 与 containerd 代理配置详解:镜像拉取速度慢的终极解决方案在企业内网、校园网络或其他受限网络环境中,使用 Docker 或 containerd 拉取外部镜像时常常遇到网络问题。本文基于实际运维经验,详细介绍如何为 Docker 和 containerd 配置代理,解决镜像拉取慢或失败的问题。
HalvmånEver12 小时前
java·linux·运维
Linux:线程互斥在多核 CPU 时代,多线程并发是提升程序性能的关键,但线程间对共享资源的 “争抢” 往往会导致数据错乱、结果异常等问题。线程互斥技术通过 “锁” 机制,保证同一时刻只有一个线程能访问临界资源,是解决并发冲突的核心方案。本文从问题本质出发,带你理解线程互斥的原理、工具使用与工程实践。
JY.yuyu12 小时前
运维·docker·容器
Docker常用命令——数据卷管理 / 端口映射 / 容器互联目录一,Docker 数据卷管理1.创建数据卷2.查看数据卷详细信息3.列出已有的数据卷4.删除指定的数据卷
lpruoyu13 小时前
运维·docker·容器
【Docker进阶-06】docker-compose & docker swarmcompose + docker swarm == 集群部署https://docs.docker.com/compose/install/ https://docs.docker.com/reference/compose-file/services/#build
China_Yanhy14 小时前
运维·机器人·web3
入职 Web3 运维日记 · 第 8 日:黑暗森林 —— 对抗 MEV 机器人的“三明治攻击”时间:入职第 8 天 天气:阴沉(像极了以太坊那深不见底的内存池) 事件:做市商团队 (Market Maker) 投诉交易滑点过高
艾莉丝努力练剑14 小时前
运维·c++·人工智能·cann
hixl vs NCCL:昇腾生态通信库的独特优势分析在人工智能和高性能计算领域,分布式训练已成为处理大规模模型和数据的标配技术。通信库作为分布式系统的核心组件,直接决定了训练效率和系统扩展性。在昇腾(Ascend)AI生态中,华为推出了hixl(Huawei Collective Communication Library),与业界广泛使用的NCCL(NVIDIA Collective Communication Library)形成了有趣的对比。本文将深入分析hixl在昇腾生态中的独特优势,并通过代码示例展示其实际应用。
酉鬼女又兒14 小时前
linux·运维·服务器
每天一个Linux命令_printf对比维度printf 命令echo 命令核心功能格式化输出(类C语言printf),侧重“精准排版”简单输出字符串/变量,侧重“快速打印”