发布时间:2025-06-26 16:14:04
报告人简介:
王钢,北京理工大学自动化学院教授、博士生导师,研究无人系统数据驱动控制和世界模型学习。入选国家级领军人才项目,主持国家重点研发计划青年、国家自然科学基金联合重点等项目,在IEEE TIT/TAC等汇刊发表论文60篇,NeurIPS/ICRA/IROS/CDC等国际会议发表论文50篇。获IEEE信号处理学会“优秀编委奖”、中国工程院院刊《信息与电子工程前沿(英文版)》“最佳论文奖”、欧洲信号处理会议“最佳学生论文奖”、中国自动化学会自然科学一等奖、“优秀博士论文奖”等。现担任Signal Processing、IEEE Trans. Signal and Information Processing over Networks、IEEE Open Journal of Control Systems编委,以及中国自动化学会控制理论专业委员会委员、中国自动化学会具身智能专委会副主任委员、中国指挥与控制学会青年工作委员会副总干事等。
报告摘要:
世界模型通过“想象”生成数据,显著提升了样本效率并降低了训练成本,是实现智能体高效自主决策的关键途径。本报告介绍了我们在世界模型方面的三个初步成果。提出基于Transformer架构的世界模型STORM,在Atari 100k基准上取得SOTA性能,训练时间和资源消耗显著低于经典DreamerV3算法。DyMoDreamer 通过引入动态调制机制,提升模型对环境变化的敏感性,在Atari 100k与DMControl等多个基准中均取得SOTA性能。SBR用状态检索构建高质量策略,在模仿学习中实现了对DreamerV3的全面超越。这些成果展示了世界模型强化学习的核心优势与应用潜力,为实现通用人工智能奠定了基础。