kernel

mounter6257 天前
linux·网络·人工智能·内存管理·kernel
深度解析 dmabuf/devmem:从图形渲染到 AI 与高性能网络的演进之路在高性能计算与异构计算的今天,如何实现数据在不同硬件(GPU、NIC、DSP)之间的“零拷贝”传输,是性能优化的核心。dmabuf(DMA Buffer)作为 Linux 内核中跨设备缓冲区共享的标准框架,已经从最初的图形领域走到了 AI 与 800G 网络的前沿。
mounter62510 天前
linux·ebpf·kernel·netkit
比 veth 更强、为 eBPF 而生:深度解析 Linux netkit 虚拟网卡驱动在云原生网络(如 Cilium、Calico)的演进过程中,veth-pair 一直是连接容器与宿主机的功臣。然而,随着对高性能、低延迟的极致追求,传统 veth 的协议栈开销逐渐成为瓶颈。
mounter62517 天前
linux·服务器·网络·tcp/ip·kernel
深入理解 Linux 网络新特性:netkit 中的 RX/TX Queue Leasing 与 TCP Devmem在高性能网络领域,零拷贝(Zero-copy)一直是追求的圣杯。最近在 net-next 邮件列表中,关于 netkit 设备支持 TCP devmem 以及 Queue Leasing(队列租借) 的讨论引起了广泛关注。
mounter62520 天前
linux·数据结构·链表·设计模式·内存管理·kernel
Linux Kernel Design Patterns (Part 2):从经典链表到现代 XArray,拆解内核复杂数据结构的设计哲学前言:在上一篇文章中,我们探讨了引用计数(Reference Counts)的模式。现在,我们将目光转向内核中最具挑战性的部分——复杂数据结构。
mounter6251 个月前
linux·内存管理·kernel·swap·virtual swap
【内核新动向】告别物理槽位束缚:深度解析 Linux Virtual Swap Space 机制前言在 Linux 内存管理领域,Swap(交换空间)一直是个让人又爱又恨的话题。最近,内核邮件列表(LKML)爆出一个重磅补丁系列——[PATCH v5 00/21] Virtual Swap Space。由 Meta 的 Nhat Pham 发起,联合 Johannes Weiner 等多位大牛共同打造。这一变革可能彻底改写 Linux 处理交换内存的方式。
Railshiqian1 个月前
android·kernel
安卓源码编译ko文件到设备img,并在开机阶段自动加载这里介绍安卓源码如何编译ko文件到设备img,并在开机阶段自动加载。我们要使用lunch sdk_car_md_x86_64-trunk_staging-userdebug编译出的模拟器设备来加载ko模块。 所以我们要在对应的device设备下进行配置: 1),cd android源码/device/generic/car/
Railshiqian1 个月前
android·kernel
common-android15-6.6 kernel环境下,编写并编译一个helloworld驱动模块https://blog.csdn.net/Railshiqian/article/details/160374693?spm=1011.2124.3001.6209
mounter6251 个月前
linux·运维·服务器·kernel·ipc·io_uring
【内核前沿】Linux IPC 迎来大变局?POSIX 消息队列增强、io_uring IPC 与 Bus1 十年回归前言Linux 内核虽然提供了多种进程间通信(IPC)机制(如信号量、共享内存、消息队列、Unix 域套接字等),但对于追求高性能或复杂功能的用户来说,现有的工具包总显得有些“捉襟见肘”。
mounter6251 个月前
linux·服务器·ebpf·kernel·firmware
深度拦截:Linux 内核引入 Firmware LSM 挂钩,eBPF 再下一城!引言在现代高性能计算和云原生场景下,用户空间与硬件设备的交互日益频繁。如何确保这些直接发送给固件(Firmware)的命令是安全的?传统的 Linux 安全模型似乎遇到了瓶颈。近日,内核社区提交了一项名为 “Firmware LSM hook” 的补丁集,利用 eBPF 的灵活性为固件命令穿上了“防弹衣”。
吴烦恼的博客1 个月前
linux·kernel
RK3588-kernel BringUp记录(二)uboot启动过程1. 完美的底层基建DRAM: 16 GiB Relocation Offset: ebb0c000 mmc@fe2c0000: 1, mmc@fe2e0000: 0 MMC0: HS400 Enhanced Strobe, 200Mhz
mounter6251 个月前
linux·服务器·网络·网络协议·tcp/ip·kernel·devmem
【深度解析】Device Memory TCP:开启高性能网络传输的“零拷贝”新时代1. 缘起:为什么我们需要 Device Memory TCP?在传统的数据处理流程中,当我们需要将网络数据发送到 GPU、TPU 或 SSD 等设备内存,或者从这些设备发送数据时,往往需要经历极其繁琐的步骤:
mounter6251 个月前
linux·服务器·网络·架构·kernel
【硬核前沿】CXL 深度解析:重塑数据中心架构的“高速公路”,Linux 内核如何应对挑战?-- CXL 协议详解与 LSF/MM 最新动态一、 什么是 CXL?打破“内存墙”的终极方案在过去十年中,CPU 的核心数呈指数级增长,但单核分配到的内存带宽和容量却增长缓慢。传统的 DDR 通道受限于 CPU 插槽的物理尺寸和引脚数,已经触及物理极限。与此同时,AI 大模型和大数据处理对内存的需求近乎贪婪。
mounter6251 个月前
网络·网络协议·tcp/ip·kernel·devmem tcp
【高性能网络】Devmem TCP 深度拆解:打破 100G 网络的“CPU 搬运墙”与延迟瓶颈1. 为什么需要 Devmem TCP?在传统的 Linux 网络协议栈中,数据包的传输存在一个巨大的“性能税”——内存拷贝。
mounter6252 个月前
linux·运维·服务器·kernel
Linux 7.0 重磅更新:详解 nullfs 如何重塑根文件系统挂载与内核线程隔离在即将发布的 Linux 7.0 内核中,最引入注目的早期合并之一便是 nullfs。简单来说,nullfs 是一个绝对为空的文件系统,它不支持创建任何文件,也不存储任何数据。你可能会问:内核里加入一个“一无用处”的文件系统到底图什么?
mounter6252 个月前
linux·运维·服务器·网络·p2p·kernel
深度解析 RDMA 技术的里程碑:基于 DMA-BUF 的 P2P 直接访问(GPU Direct RDMA 新姿势)前言在高性能计算(HPC)和 AI 训练场景中,GPU 与网卡(NIC)之间的数据传输效率至关重要。传统的 RDMA 访问用户空间缓冲区通常依赖 get_user_pages() 来钉住(Pin)物理内存。但当数据驻留在 GPU 显存(VRAM)时,这种方式因缺乏标准 page 结构而失效。
缘友一世2 个月前
linux·kernel
ubuntu24.04最新内核6.17.0.19卸载折腾记执行重启命令,重启时会看到GRUB引导菜单:登录后执行,正常输出应为:6.17.0-14-generic。
mounter6252 个月前
linux·运维·服务器·网络·架构·kernel
基于MLX设备的Devlink 工具全指南与核心架构演进在 Linux 网络管理领域,ip 命令负责三层网络配置,ethtool 负责二层接口属性。但随着 SmartNIC(智能网卡)和 DPU 的兴起,网卡不再只是一个简单的“数据管道”,而是一个拥有复杂内部逻辑的“片上系统”。
wifi chicken2 个月前
linux·kernel·协议栈·wifi驱动
Linux wlan 周期性维护终端管理框架详解如果前面分享出来的《双链表操作》、《哈希到哈希表…》没有理解,或许难以理解以“哈希表+链表”的桶结构下面是驱动初始化及维护设备列表的全流程
Realdagongzai4 个月前
linux·vscode·python·kernel
Python学习过程记录3-操作列表可使用 Python 中的 for 循环
习惯就好zz4 个月前
linux·kernel·printk·4.4
Linux Kernel 4.4 `printk` 源码分析与使用详解调试内核驱动最简单的方法就是使用 printk 函数。它与用户空间的 printf 格式类似,但多了一个**日志级别(Log Level)**的概念。