%0 Journal Article %A 吴佳慧 %A 熊翱 %A 颜拥 %A 喻鹏 %A 马庆刘 %T 基于深度强化学习的综合能源业务通道优化机制 %D %R 10.13190/j.jbupt.2019-103 %J 北京邮电大学学报 %P 87-93 %V 43 %N 2 %X 为了保障综合能源系统的稳定运行,承载综合能源业务的通信网络需要具备高可靠、低风险等特征.依据综合能源业务的通道要求,提出了一种深度强化学习的算法,旨在对大规模综合能源业务在承载的电力通信网上寻找到整体最优的路径.该方法以整体时延和网络负载均衡度为目标,对网络拓扑进行训练,并保存模型,然后通过迭代学习获取最优的结果.仿真结果表明,该方法找到的路径既可以保证整体时延较短,又可以保证网络的整体负载均衡.同时,在网络规模很大、业务数量很多的情况下,深度强化学习算法可有效提高计算效率. %U https://journal.bupt.edu.cn/CN/10.13190/j.jbupt.2019-103