基于Qlearning强化学习的免授权频谱下NR-U与WiFi共存资源最优分配策略matlab仿真

目录

✨1.前言

📡2.算法测试效果图预览

🔍3.算法运行软件版本

✅4.部分核心程序

🚀5.算法理论概述

[1️⃣5.1 计算共存场景下NR-U系统与WiFi系统的吞吐量](#1️⃣5.1 计算共存场景下NR-U系统与WiFi系统的吞吐量)

[2️⃣5.2 共存场景下的最优ABS数量](#2️⃣5.2 共存场景下的最优ABS数量)

[3️⃣5.3 基于Q学习匹配ABS位置](#3️⃣5.3 基于Q学习匹配ABS位置)

💡6.算法完整程序工程


✨1.前言

随着5G新空口免授权频谱(NR-U)技术的发展,5G NR系统需要与WiFi系统在免授权频谱(如5GHz和6GHz频段)上共存。由于两种系统采用不同的接入机制------NR-U基于调度的接入方式与WiFi基于竞争的CSMA/CA机制存在本质差异,直接共存会导致严重的相互干扰,降低整体频谱利用效率。因此,需要设计一种智能的资源分配方法,使两种系统能够公平、高效地共享免授权频谱资源。

本方法的核心原理是引入几乎空白子帧(Almost Blank Subframe,ABS)机制,NR-U系统在某些子帧上主动静默(即不发送数据),将这些时间资源让给WiFi系统使用,从而实现时域上的资源分割。并引入Q学习算法,通过强化学习的方式智能匹配ABS位置与WiFi系统的传输需求。Q学习是一种无模型的强化学习算法,智能体通过与环境的交互,逐步学习在每个状态下采取何种动作能够获得最大的长期累积奖励。Q学习维护一个Q值表,记录每个状态-动作对的期望累积奖励值,通过不断更新Q值表来逼近最优策略。在本方法中,Q学习被用于解决ABS位置匹配这一组合优化问题,将频谱资源分配建模为马尔可夫决策过程。

📡2.算法测试效果图预览

🔍3.算法运行软件版本

matlab2024b

✅4.部分核心程序

复制代码
% 系统参数
T = 10;                    % 一个无线帧的子帧数量
B = 20e6;                  % 系统带宽 20MHz
P_NR = 23;                 % NR-U发射功率 (dBm)
P_WiFi = 20;               % WiFi发射功率 (dBm)
N0_dBm = -174;             % 噪声功率谱密度 (dBm/Hz)
N0 = 10^((N0_dBm-30)/10);  % 转换为瓦特

% 信道参数
g_NR = 10^(-80/10);        % NR-U信道增益 (路径损耗80dB)
g_WiFi = 10^(-75/10);      % WiFi信道增益
g_cross = 10^(-90/10);     % 交叉干扰信道增益

% 功率转换
P_NR_W = 10^((P_NR-30)/10);
P_WiFi_W = 10^((P_WiFi-30)/10);

% WiFi CSMA/CA参数
n_wifi = 5;                % WiFi竞争节点数
tau = 0.05;                % 每个节点传输概率

% 业务需求
D_NR = 50e6;               % NR-U业务需求 (bps)
D_WiFi = 30e6;             % WiFi业务需求 (bps)

🚀5.算法理论概述

1️⃣5.1 计算共存场景下NR-U系统与WiFi系统的吞吐量

首先建立共存场景的系统模型。假设在免授权频谱上,存在一个NR-U基站和多个WiFi接入点(AP),它们共享相同的频谱资源。设NR-U系统的带宽为B,一个无线帧包含T个子帧。

NR-U系统吞吐量计算:

当NR-U系统在非ABS子帧上传输数据时,其信号干扰噪声比(SINR)为

其中PNR为NR-U基站的发射功率,gNR为NR-U基站到用户的信道增益,N0为噪声功率谱密度,M为WiFi接入点的数量,PWiFi,j为第j个WiFi AP的发射功率,gj,NR为第j个WiFiAP对NR-U用户的干扰信道增益。

NR-U系统在一个无线帧内的可用子帧数为T−NABS​,其中NABS​为ABS的数量。NR-U系统的吞吐量为:

WiFi系统吞吐量计算:

WiFi系统采用CSMA/CA协议进行信道竞争接入。设WiFi网络中有n个竞争节点,每个节点的传输概率为τ。WiFi系统成功传输的概率为:

WiFi系统在信道空闲时(包括NR-U的ABS期间)可以进行传输。WiFi用户的SINR为:

其中INR​为NR-U系统对WiFi用户造成的干扰,1non−ABS​为指示函数,在非ABS子帧期间取值为1,在ABS子帧期间取值为0。WiFi系统的归一化吞吐量可以基于Bianchi模型计算:

考虑ABS的影响,WiFi系统的有效吞吐量与ABS数量和位置密切相关。当ABS位置与WiFi系统的传输时机良好匹配时,WiFi系统能获得更多的无干扰传输机会,其有效吞吐量为:

根据计算得到的吞吐量,分别确定NR-U系统与WiFi系统对频谱资源的需求比例:

其中DNR和DWiFi​分别为两个系统的业务需求量。

2️⃣5.2 共存场景下的最优ABS数量

最优ABS数量的确定需要在NR-U系统和WiFi系统之间取得公平性与总吞吐量的平衡。定义ABS比例因子为q,则ABS占无线帧的比例为(1−q),即NR-U系统在比例为q的子帧上传输数据。建立以比例公平性为准则的优化目标函数:

其中α为权重因子,用于调节两个系统之间的公平性,RNR,min和 RWiFi,min分别为两个系统的最低吞吐量保障。

3️⃣5.3 基于Q学习匹配ABS位置

确定了ABS的数量NABS​后,需要确定这些ABS在无线帧中的具体位置。这是一个组合优化问题,可能的位置组合数为 (TNABS),随着T和NABS 的增大,穷举搜索的计算复杂度将急剧增长。因此,本方法采用Q学习来高效求解此问题。

状态空间: 状态s定义为当前已分配的ABS位置集合以及WiFi系统的信道状态信息。

其中sch表示WiFi系统当前的信道状态(繁忙、空闲、碰撞),sABS表示已确定的ABS位置向量 a=[a1,a2,...,aT],ai∈{0,1}a表示第i个子帧是否为ABS。

动作空间: 动作 aa 定义为在当前子帧位置上的决策。

其中0表示该子帧为正常传输子帧,1表示该子帧为ABS。

奖励函数: 奖励函数综合考虑系统总吞吐量和公平性。

其中β1​、β2​、β3​为权重系数,第一项鼓励最大化总吞吐量,第二项保证公平性,第三项惩罚ABS数量偏离最优值的情况。

Q值更新规则:

Q学习的核心更新公式为:

其中αl为学习率(0<αl≤10<αl​≤1),控制新信息对已有知识的更新程度;γd为折扣因子(0≤γd<1),决定未来奖励的重要性;rt+1为在状态st下执行动作at后获得的即时奖励。

💡6.算法完整程序工程

OOOOO

OOO

O

关注GZH后输入回复:0038

相关推荐
guygg881 天前
极化码(Polar Codes)的MATLAB实现
开发语言·数据结构·matlab
机器学习之心1 天前
电池SOH估计和RUL预测,基于BiLSTM神经网络的锂电池健康状态估计和剩余寿命预测,MATLAB代码
人工智能·神经网络·matlab·电池soh估计·rul预测·bilstm神经网络
ghie90901 天前
MATLAB 解线性方程组的迭代法
开发语言·算法·matlab
wearegogog1232 天前
光伏发电系统最大功率跟踪(MPPT)算法 Matlab 实现指南
开发语言·算法·matlab
slandarer2 天前
MATLAB | R2026a 更新了哪些有趣的新东西?
开发语言·数据库·matlab
gihigo19982 天前
MATLAB地震面波数值模拟方案
开发语言·matlab
可编程芯片开发2 天前
基于Voronoi自适应分区的Qlearning强化学习粒子群算法的海上风电场电气系统拓扑优化matlab仿真
matlab·voronoi·qlearning·拓扑优化·自适应分区·海上风电场
关岭风尘2 天前
Matlab/Simulink - BLDC直流无刷电机仿真基础教程(九) - BLDC电机滑行状态低占空比启动波形分析
matlab·电机控制·bldc仿真·电机续流·滑行启动
Not Dr.Wang4222 天前
基于matlab的控制系统奈氏图及其稳定性分析
数据结构·算法·matlab