技术栈
kernel
mounter625
7 天前
linux
·
网络
·
人工智能
·
内存管理
·
kernel
深度解析 dmabuf/devmem:从图形渲染到 AI 与高性能网络的演进之路
在高性能计算与异构计算的今天,如何实现数据在不同硬件(GPU、NIC、DSP)之间的“零拷贝”传输,是性能优化的核心。dmabuf(DMA Buffer)作为 Linux 内核中跨设备缓冲区共享的标准框架,已经从最初的图形领域走到了 AI 与 800G 网络的前沿。
mounter625
10 天前
linux
·
ebpf
·
kernel
·
netkit
比 veth 更强、为 eBPF 而生:深度解析 Linux netkit 虚拟网卡驱动
在云原生网络(如 Cilium、Calico)的演进过程中,veth-pair 一直是连接容器与宿主机的功臣。然而,随着对高性能、低延迟的极致追求,传统 veth 的协议栈开销逐渐成为瓶颈。
mounter625
17 天前
linux
·
服务器
·
网络
·
tcp/ip
·
kernel
深入理解 Linux 网络新特性:netkit 中的 RX/TX Queue Leasing 与 TCP Devmem
在高性能网络领域,零拷贝(Zero-copy)一直是追求的圣杯。最近在 net-next 邮件列表中,关于 netkit 设备支持 TCP devmem 以及 Queue Leasing(队列租借) 的讨论引起了广泛关注。
mounter625
20 天前
linux
·
数据结构
·
链表
·
设计模式
·
内存管理
·
kernel
Linux Kernel Design Patterns (Part 2):从经典链表到现代 XArray,拆解内核复杂数据结构的设计哲学
前言:在上一篇文章中,我们探讨了引用计数(Reference Counts)的模式。现在,我们将目光转向内核中最具挑战性的部分——复杂数据结构。
mounter625
1 个月前
linux
·
内存管理
·
kernel
·
swap
·
virtual swap
【内核新动向】告别物理槽位束缚:深度解析 Linux Virtual Swap Space 机制
前言在 Linux 内存管理领域,Swap(交换空间)一直是个让人又爱又恨的话题。最近,内核邮件列表(LKML)爆出一个重磅补丁系列——[PATCH v5 00/21] Virtual Swap Space。由 Meta 的 Nhat Pham 发起,联合 Johannes Weiner 等多位大牛共同打造。这一变革可能彻底改写 Linux 处理交换内存的方式。
Railshiqian
1 个月前
android
·
kernel
安卓源码编译ko文件到设备img,并在开机阶段自动加载
这里介绍安卓源码如何编译ko文件到设备img,并在开机阶段自动加载。我们要使用lunch sdk_car_md_x86_64-trunk_staging-userdebug编译出的模拟器设备来加载ko模块。 所以我们要在对应的device设备下进行配置: 1),cd android源码/device/generic/car/
Railshiqian
1 个月前
android
·
kernel
common-android15-6.6 kernel环境下,编写并编译一个helloworld驱动模块
https://blog.csdn.net/Railshiqian/article/details/160374693?spm=1011.2124.3001.6209
mounter625
1 个月前
linux
·
运维
·
服务器
·
kernel
·
ipc
·
io_uring
【内核前沿】Linux IPC 迎来大变局?POSIX 消息队列增强、io_uring IPC 与 Bus1 十年回归
前言Linux 内核虽然提供了多种进程间通信(IPC)机制(如信号量、共享内存、消息队列、Unix 域套接字等),但对于追求高性能或复杂功能的用户来说,现有的工具包总显得有些“捉襟见肘”。
mounter625
1 个月前
linux
·
服务器
·
ebpf
·
kernel
·
firmware
深度拦截:Linux 内核引入 Firmware LSM 挂钩,eBPF 再下一城!
引言在现代高性能计算和云原生场景下,用户空间与硬件设备的交互日益频繁。如何确保这些直接发送给固件(Firmware)的命令是安全的?传统的 Linux 安全模型似乎遇到了瓶颈。近日,内核社区提交了一项名为 “Firmware LSM hook” 的补丁集,利用 eBPF 的灵活性为固件命令穿上了“防弹衣”。
吴烦恼的博客
1 个月前
linux
·
kernel
RK3588-kernel BringUp记录(二)
uboot启动过程1. 完美的底层基建DRAM: 16 GiB Relocation Offset: ebb0c000 mmc@fe2c0000: 1, mmc@fe2e0000: 0 MMC0: HS400 Enhanced Strobe, 200Mhz
mounter625
1 个月前
linux
·
服务器
·
网络
·
网络协议
·
tcp/ip
·
kernel
·
devmem
【深度解析】Device Memory TCP:开启高性能网络传输的“零拷贝”新时代
1. 缘起:为什么我们需要 Device Memory TCP?在传统的数据处理流程中,当我们需要将网络数据发送到 GPU、TPU 或 SSD 等设备内存,或者从这些设备发送数据时,往往需要经历极其繁琐的步骤:
mounter625
1 个月前
linux
·
服务器
·
网络
·
架构
·
kernel
【硬核前沿】CXL 深度解析:重塑数据中心架构的“高速公路”,Linux 内核如何应对挑战?-- CXL 协议详解与 LSF/MM 最新动态
一、 什么是 CXL?打破“内存墙”的终极方案在过去十年中,CPU 的核心数呈指数级增长,但单核分配到的内存带宽和容量却增长缓慢。传统的 DDR 通道受限于 CPU 插槽的物理尺寸和引脚数,已经触及物理极限。与此同时,AI 大模型和大数据处理对内存的需求近乎贪婪。
mounter625
1 个月前
网络
·
网络协议
·
tcp/ip
·
kernel
·
devmem tcp
【高性能网络】Devmem TCP 深度拆解:打破 100G 网络的“CPU 搬运墙”与延迟瓶颈
1. 为什么需要 Devmem TCP?在传统的 Linux 网络协议栈中,数据包的传输存在一个巨大的“性能税”——内存拷贝。
mounter625
2 个月前
linux
·
运维
·
服务器
·
kernel
Linux 7.0 重磅更新:详解 nullfs 如何重塑根文件系统挂载与内核线程隔离
在即将发布的 Linux 7.0 内核中,最引入注目的早期合并之一便是 nullfs。简单来说,nullfs 是一个绝对为空的文件系统,它不支持创建任何文件,也不存储任何数据。你可能会问:内核里加入一个“一无用处”的文件系统到底图什么?
mounter625
2 个月前
linux
·
运维
·
服务器
·
网络
·
p2p
·
kernel
深度解析 RDMA 技术的里程碑:基于 DMA-BUF 的 P2P 直接访问(GPU Direct RDMA 新姿势)
前言在高性能计算(HPC)和 AI 训练场景中,GPU 与网卡(NIC)之间的数据传输效率至关重要。传统的 RDMA 访问用户空间缓冲区通常依赖 get_user_pages() 来钉住(Pin)物理内存。但当数据驻留在 GPU 显存(VRAM)时,这种方式因缺乏标准 page 结构而失效。
缘友一世
2 个月前
linux
·
kernel
ubuntu24.04最新内核6.17.0.19卸载折腾记
执行重启命令,重启时会看到GRUB引导菜单:登录后执行,正常输出应为:6.17.0-14-generic。
mounter625
2 个月前
linux
·
运维
·
服务器
·
网络
·
架构
·
kernel
基于MLX设备的Devlink 工具全指南与核心架构演进
在 Linux 网络管理领域,ip 命令负责三层网络配置,ethtool 负责二层接口属性。但随着 SmartNIC(智能网卡)和 DPU 的兴起,网卡不再只是一个简单的“数据管道”,而是一个拥有复杂内部逻辑的“片上系统”。
wifi chicken
2 个月前
linux
·
kernel
·
协议栈
·
wifi驱动
Linux wlan 周期性维护终端管理框架详解
如果前面分享出来的《双链表操作》、《哈希到哈希表…》没有理解,或许难以理解以“哈希表+链表”的桶结构下面是驱动初始化及维护设备列表的全流程
Realdagongzai
4 个月前
linux
·
vscode
·
python
·
kernel
Python学习过程记录3-操作列表
可使用 Python 中的 for 循环
习惯就好zz
4 个月前
linux
·
kernel
·
printk
·
4.4
Linux Kernel 4.4 `printk` 源码分析与使用详解
调试内核驱动最简单的方法就是使用 printk 函数。它与用户空间的 printf 格式类似,但多了一个**日志级别(Log Level)**的概念。