随着“双碳计划”的实施,综合能源系统中光伏和风力等分布式能源渗透率越来越高,对应的源-荷不确定性对综合能源系统优调度带来巨大的挑战。针对上述问题,提出一种基于安全层强化学习的综合能源优化调度方法。强化学习不需要准确的模型信息,离线训练时利用历史数据训练神经网络建立从“状态”到“动作”的函数映射网络,在线调度时只需要当前时刻的源荷数据,即可获得日内实时调度方案。此外,该方法还解决了现有强化学习方法进行实时调度离线训练时,采用奖励函数惩罚处理综合能源系统中各设备的运行约束时造成的训练效率较低的问题。