近日,我校机械与电气工程学院卢尧副教授在智能制造领域国际TOP期刊《ADVANCED ENGINEERING INFORMATICS》(中科院SCI一区,IF=9.9)发表题为“A renewable energy aware multi-agent reinforcement learning approach for the dynamic flexible job shop scheduling problem“的研究论文。

随着可再生能源技术的飞速发展以及制造业绿色转型需求的日益迫切,将可再生能源融入生产调度已成为一大主流趋势。针对可再生能源的间歇性问题,提出了一种考虑可再生能源供应的多目标动态柔性作业车间调度问题,该问题模型同时纳入了动态到达的作业任务与波动变化的交货期因素。此模型旨在动态平衡传统生产目标与低碳目标。为实现高效的多目标优化,研究构建了一种新型的、具有分层决策机制的多智能体深度强化学习协同框架,该框架包含两类功能不同的智能体:第一类智能体基于 PPO(近端策略优化)算法动态选择待加工作业任务;第二类智能体基于 DDQN(双深度 Q 网络)算法,将所选作业中未完成的工序分配至合适的机器。两类智能体通过协同配合,实现高效的任务调度与资源分配。此外,研究还根据问题特征,针对性设计了状态输入、动作空间与奖励函数。

某微电网24小时可再生能源发电曲线

柔性作业车间的框架示意图
在静态基准算例与包含作业插入、交货期变更的动态场景下开展的实验结果表明:所提方法在全部三个优化目标上,对60%的静态算例与66%的动态算例均能求得最优解,且其性能显著优于传统调度规则与广泛使用的多智能体算法。

多种调度算法在经典算例下的IGD值对比

多种调度算法在经典算例下的HV值对比
该论文第一作者系卢尧副教授(通讯作者)指导的2023级硕士研究生马晴瑶。该研究得到国家自然科学基金(Grant No.72061006)和贵州省基础研究计划(自然科学)(Grant No. Qian Ke He Ji Chu-ZK [2024] General 439)以及贵州省研究生科研基金项目(Grant No. 2024YJSKYJJ165)的联合资助。
论文全文链接:https://doi.org/10.1016/j.aei.2025.104113