报告题目:基础设施资产管理优化的深度强化学习算法
报 告 人:袁贤讯 教授
主 持 人:陈华鹏 教授
报告时间:2025年12月10日(周三)下午2:30
报告地点:教38栋301会议室
报告人简介:
袁贤讯,加拿大多伦多都会大学(Toronto Metropolitan University)土木工程教授,原系主任。研究领域涉及工程风险与可靠度、政府与社会资本合作(Public-Private Partnership)、工程项目管理、工程结构抗震与抗连续倒塌设计等。近年来着重于基础设施资产管理,特别是它与深度强化学习以及发展经济学结合等方面的研究工作。袁教授是加拿大土木工程学会(CSCE)资产管理技术委员会主席、加拿大资产管理经理协会(CNAM)董事会成员、英国土木工程师学会(ICE)国际期刊基础设施资产管理(Infrastructure Asset Management)副主编,美国土木工程师学会(ASCE)基础设施系统期刊 (Journal of Infrastructure Systems) 副主编。

报告内容:
中国高密度的基础建设期已经过去,未来需要面对的将是长期的基础设施再投资以确保已将资产的服役水平和安全性能维持在一个可接受的范围,这给土木工程师带来了全新的挑战。基础设施资产管理不仅需要坚定的领导力和跨部门协作,还依赖于复杂的数据分析和数学优化技能。传统的基础设施资产管理优化方法针对大规模网络在预算约束时有时甚至无法找到满意的可行解。传统算法的可扩展性(Scalability) 是一个巨大挑战。本次演讲中,报告人将介绍一种新型深度强化学习框架用以优化大型基础设施网络的资产管理策略。通过将网络层面的马尔可夫决策过程分解为单个资产层面的马尔可夫决策过程,并采用统一的神经网络架构,大大降低了计算复杂度,提升了学习效率,同时增强了可扩展性。报告人还将介绍一种改进的遗传算法,该算法能确保可行解,并显著提高获得全局最优解的概率。此外,报告将对两种提出算法的性能比较进行探讨。
热忱欢迎广大师生积极参加!
交通运输工程学院
2025年12月5日