作者:赵晔 核稿:白宗文
近日,我校物理与电子信息学院张富春教授团队撰写的论文《Intention Action Anticipation Model with Guide-Feedback Loop Mechanism》被人工智能领域国际顶级学术期刊Knowledge-Based Systems(IF=8.8,中科院一区TOP期刊)正式接收并在线发表。
随着自动驾驶、机器人技术和虚拟现实等领域的迅速发展,准确预测人类意图成为了一个重要的研究方向。然而,现有的预测方法存在一定的局限性,特别是在处理复杂、动态的人类行为时往往未能充分利用视频的全局和局部特征来预测未来的行为。
针对以上问题,本文提出了一个层级的完整-近期信息融合模型(HCR),该模型充分利用了整个视频序列的特征(即完整特征)和视频尾部序列的特征(即近期特征)。HCR模型中的两个主要机制:指导-反馈循环(GFL)机制旨在模拟一个近期特征与一个完整特征之间的关系;基于GFL的多完整-近期特征聚合(MCRFA)模块用于模拟一个近期特征与多尺度完整特征之间的关系。通过这两种机制,HCR模型能够层次化地探索多尺度完整特征与多尺度近期特征之间丰富的内部关系。研究结果在两个大型的公开数据集上的一系列比较和消融实验验证了HCR模型的有效性。
截止目前,马宗楠共参与撰写了4篇学术论文,其中在2023年的机器人领域顶级会议(Robotics:Science and Systems Foundation)上与来自麻省理工学院、普林斯顿大学、哈佛大学和剑桥大学等国际一流大学的8位同学在“Contributed Talks”环节进行了论文成果演讲和分享。另外撰写的2篇SCI论文正在审稿中。
论文链接:https://www.sciencedirect.com/science/article/pii/S0950705124002612?via=ihub