本成果公开了一种基于时空特征的行人轨迹预测方法。首先,通过构建基于传统的置信域策略优化算法(Trust Region Policy Optimization, TRPO)和改进的近端策略优化算法(PPO-penalty)的实验,验证了基于PPO-penalty的GAIL(Generative Adversarial Imitation Learning,生成对抗式模仿学习)模型具有较大的优势,因此选择GAIL(PPO-penalty)结构实现行人轨迹预测。然后,为了提高信息的利用率,防止信息的丢失,引入了ConstantPadding(常数填充)的方法,并将该方法命名为ConstantPadding-GAIL。最后,创新性的提出使用Mogrifier LSTM抽取行人历史信息中存在的时序特征,并将其融合到当前状态的实验构建。本成果使用基于PPO-penalty的GAIL模型在已有的行人历史真实轨迹数据集基础上,学习行人在社交场合中如何运动,从而预测行人轨迹。根据调查和检索,目前还结合生成对抗模仿学习GAIL并且考虑社交特性进行预测的工作,本成果填补了行人路径预测技术方面的空缺。