记录一下返修

1.对复杂度的分析还不够;

2.融合两种指标的解释还不够,审稿人认为这两种指标存在冲突,不能同时优化,但其实我们考虑的是公平性保证整个调度周期内用户分配到了更加平均的sum-rate,而se是为了追求每个调度时刻都尽可能找到信道条件最好的用户。虽然看起来冲突,但是公平性作为se的系数会影响整体的reward,因为后期策略学习到了不会违规,即每次能选择的用户数量保持一定。然后如果经过这么多调度时刻之后学到了一个不好的策略,fair维持到一个比较低的值,作为系数会极大影响奖励因为如果系数偏低可能降低一个数量级或者减半,而后期如果fair能够找到一个高点,此时获得的se虽然相比于最优策略低但是由于选择的用户数量基本一致,所以整体还是维持在一个数量级,这样就实现了两种指标的平衡;

从实验得到的数据也可以看到,两种指标其实是能够在调度周期内的后期实现一个平衡的。

3.第三个审稿人提出的更多是关于写作方面的问题;

4.第一个审稿人和第四个审稿人提出的关于补充实验的问题比较多;

5.关于时间性能上无法符合5G的亚毫秒级,我感觉是因为自己机器的推理速度导致的。根本不可能达到审稿人说的这个速度;这个问题该怎么回?

6.和PPO比较了,和其他算法比较,实现起来不是不可以就是需要改动很多,因为本身就是对策略网络进行了复杂的加工,改用SAC这种,还是比较复杂,用A2C这种原始的比较简单。

7.奖励函数融合了两种指标和两种惩罚项。进行了消融实验

相关推荐
吃好睡好便好17 小时前
在Matlab中绘制二维直方图
开发语言·人工智能·学习·算法·matlab
温九味闻醉18 小时前
关于腾讯广告算法大赛2025项目面试要点
人工智能·算法·机器学习
sheeta199818 小时前
LeetCode 每日一题笔记 日期:2026.05.15 题目:153. 寻找旋转排序数组中的最小值
笔记·算法·leetcode
ZPC821018 小时前
moveit2_servo 怎么接收相机调节指令(视觉伺服)
人工智能·数码相机·算法·计算机视觉·机器人
灰灰勇闯IT18 小时前
CANN Graph Engine 执行链路:一张计算图如何跑上昇腾 NPU
人工智能·深度学习·算法
Gigavision18 小时前
SEED-VII 数据集介绍:面向七类情绪识别的 EEG 与眼动多模态数据集
人工智能·python·算法·脑机接口
KaMeidebaby18 小时前
卡梅德生物技术快报|Fab 抗体文库构建标准化实验流程与数据复盘
服务器·前端·数据库·人工智能·算法
想唱rap18 小时前
IO多路转接之epoll
linux·运维·服务器·数据库·网络协议·算法·http
zcg194219 小时前
图像分割——常用数据和算法
算法
子午19 小时前
基于YOLO的车牌识别检测~Python+YOLOV8算法+车牌定位+车牌检测+深度学习
python·算法·yolo