一种用于无人机任务卸载的轻量级深度强化学习框架

中文论文标题

TinyDeepUAV:一种用于无人机任务卸载的轻量级深度强化学习框架

英文论文标题

TinyDeepUAV: A Tiny Deep Reinforcement Learning Framework for UAV Task Offloading in Edge-Based Consumer Electronics

作者信息

  • Sujit Bebortta (Graduate Student Member, IEEE)

    • 部门:计算机科学系
    • 学校:Ravenshaw University
    • 地址:Cuttack 753003, India
    • 邮箱:sujitbebortta.cs@ravenshawuniversity.ac.in
  • Subhranshu Sekhar Tripathy

    • 学校:KIIT Deemed to be University
    • 地址:Bhubaneswar 751024, India
    • 邮箱:subhranshu.008@gmail.com
  • Surbhi Bhatia Khan

    • 学校:University of Salford, U.K. 和 Lebanese American University, Lebanon
    • 邮箱:s.khan138@salford.ac.uk
  • Maryam M. Al Dabel

    • 学校:University of Hafr Al Batin, Saudi Arabia
    • 邮箱:maldabel@uhb.edu.sa
  • Ahlam Almusharraf

    • 学校:Princess Nourah bint Abdulrahman University, Saudi Arabia
    • 邮箱:aialmusharraf@pnu.edu.sa
  • Ali Kashif Bashir (Senior Member, IEEE)

    • 学校:Manchester Metropolitan University, U.K. 和 Lebanese American University, Lebanon
    • 邮箱:dr.alikashif.b@ieee.org

论文出处

  • 期刊名称:IEEE Transactions on Consumer Electronics
  • 卷号:70
  • 期号:4
  • 日期:2024年11月
  • DOI:10.1109/TCE.2024.3445290

论文主要内容

摘要

本文提出了一种创新的框架TinyDeepUAV,用于解决无人机与资源受限的边缘设备之间的计算卸载问题。该框架采用多目标深度强化学习(DRL)技术,通过TinyML的概念在延迟和能耗之间找到平衡。TinyDeepUAV开发了一个低复杂度的框架,使其能够在边缘设备上卸载任务。针对边缘无人机网络的动态特性,TinyDeepUAV建议使用向量强化方法,根据不同的用户偏好动态调整权重。此外,通过双斗士深度Q网络(D3QN)进一步优化了TinyDeepUAV的结构,以实现优化问题的最佳改进。模拟结果表明,该方法在延迟和能耗之间实现了权衡,能够更有效地进行卸载决策,并优于基准方法.

引言

近年来,无人机在消费电子中的应用日益增多,尤其是在关键情况下。物联网技术和廉价边缘计算设备的可用性为各种领域的功能增强提供了新的前景。然而,无人机与资源受限的边缘设备之间的计算卸载面临挑战。本文提出的TinyDeepUAV策略引入了一种基于边缘智能的新技术,与当前的DRL方法不同,TinyDeepUAV不使用加权和将多目标问题转化为单目标问题,而是通过向量奖励信号来更清晰地表示目标.

相关工作

本文回顾了无线信道增益的时变性对复杂城市环境中卸载选择的影响,以及传统边缘计算网络在电池充电优化中的性能优化。相关研究主要集中在任务卸载机制和无人机轨迹优化、资源卸载和轨迹设计等方面。这些研究通常假设所有任务具有相同的资源需求,而本文则考虑了边缘网络计算工作负载的多样性.

系统模型

本文研究了一个由U架无人机和F个边缘设备组成的无人机系统。无人机在预设区域内飞行,每个无人机都配备有处理服务器,能够处理边缘设备的计算密集型任务。每个边缘设备都有一个计算密集型应用,通过有向无环图(DAG)模拟任务调度问题。系统模型包括延迟模型、能量模型、信道模型等,详细描述了无人机和边缘设备在任务卸载中的计算和传输过程.

DRL框架

本文采用多目标马尔可夫决策过程(MDP)来定义无人机的计算卸载问题。状态空间、动作空间、状态转移概率矩阵、奖励函数、偏好空间和标量化函数等构成了多目标MDP的六元组。通过将标量奖励扩展为向量奖励,TinyDeepUAV能够更好地处理多目标优化问题.

结果与讨论

本文通过MATLAB 2020a对提出的边缘无人机环境进行了模拟。假设网络中有两个边缘设备和三个配备边缘服务器的无人机。通过与MADDPG、DQN和DRL等基准框架的比较,验证了TinyDeepUAV在延迟和能耗方面的优越性能。实验结果表明,TinyDeepUAV在不同的系统参数(如学习率、批量大小和缓冲区大小)下均表现出良好的性能.

结论与未来工作

本文利用TinyML和多目标MDP优化了资源受限的边缘无人机的计算卸载中的延迟和能耗。通过D3QN框架,本文提出了一种更新的多目标问题,以应对无人机系统的动态特性和基于消费的边缘设备中的不确定性。未来的研究将探讨将进化算法与强化学习相结合的混合解决方案,并在决策中增加定价和风险意识,以解决无人机计算卸载问题.

相关推荐
谢的2元王国2 分钟前
小数据量样本 2500条之下 且每条文本长度不超过35个字的时候 多词汇平均向量外加word2vec的语义模型处理后再到特征向量中检索即可
人工智能·自然语言处理·word2vec
sali-tec2 分钟前
C# 基于OpenCv的视觉工作流-章8-形态学
人工智能·深度学习·opencv·算法·计算机视觉
IT_陈寒4 分钟前
2024年JavaScript开发者必备的10个ES13新特性实战指南
前端·人工智能·后端
智慧化智能化数字化方案4 分钟前
【精品资料鉴赏】详解企业研发生产一体化总体规划建设方案
大数据·人工智能·企业研发生产一体化·企业如何开展数字化转型·企业数字化营销·数字化转型咨询规划·数字化转型架构
IT·小灰灰6 分钟前
DMXAPI驱动的小说生成系统:从集成到优化的完整实践
人工智能·aigc
Cx330❀8 分钟前
脉脉平台深度测评:【AI创作者xAMA】从职场社交到AI创作赋能
数据库·人工智能·脉脉
执笔论英雄8 分钟前
【RL】importance_sampling Ratio的计算
人工智能
攻城狮7号12 分钟前
通用 GUI 智能体基座 MAI-UI 开源:告别“人工智障”?
人工智能·mai-ui·tongyi-mai·阿里通义实验室·gui智能体
寻星探路12 分钟前
【深度长文】深入理解网络原理:TCP/IP 协议栈核心实战与性能调优
java·网络·人工智能·python·网络协议·tcp/ip·ai
轻竹办公PPT12 分钟前
实测多款 AI:2026 年工作计划 PPT 哪种更好修改
人工智能·python·powerpoint