近日,我校工学部人工智能学院范晨悠老师以第一作者身份在人工智能领域顶级期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) 上发表题为“Few-Shot Multi-Agent Perception with Ranking-Based Feature Learning”的论文。
TPAMI是人工智能领域的顶级期刊之一,其影响因子为24.314,在人工智能、计算机视觉、模式识别等多个领域的期刊中常年位居第一,每年仅200篇左右的全球录用量。该期刊是中国计算机学会(CCF)推荐的A类期刊,同时也是我校列入计算机科学与技术学科代表性成果推荐目录的顶尖B层次的期刊之一。
论文重点关注在多智能体场景下进行少样本感知的有效方法。在该场景下,单个智能体只有稀少和部分的标注数据,因此需要协同预测查询数据的标签。作者设计了一个多智能体协作框架,在少量数据和有限算力和通讯条件下,实现多智能体协同感知。该框架包含三个主要组成部分:一个有效的通信机制,支持从查询智能体(query agent)向支撑智能体(support agent)传播紧凑且精细的查询特征图(query feature maps);一个非对称注意力机制来计算查询和支持特征图之间的细粒度注意力权重;以及一种度量学习方法可以快速准确地计算查询和支持图像之间的总体相关性。作者进一步设计了一种基于排序的特征学习方法(ranking-based feature learning),通过显式地最大化类间距离(inter-class distance) 和最小化类内距离(intra-class distance) ,来充分利用少量训练数据构建具有区分度的特征空间。通过全面的数值实验,论文的方法在人脸识别、语义分割和音乐类型识别等感知任务中可以显著提高准确性,且一致的优于现有基线方法5%-20%。
图2:最大化类间距离的任务示意图。