• 学院新闻

喜报!我院七项成果被人工智能顶级会议AAAI 2026录用
作者: 发布日期:2025-11-25 浏览次数:

近日,我院师生共有7项研究成果被国际顶级学术会议AAAI 2026(The 40th Annual AAAI Conference on Artificial Intelligence)录用!

 

AAAI会议是由国际人工智能促进协会主办的国际顶级学术会议是人工智能领域中历史最悠久、涵盖内容最广泛的会议之一,在全球学术界与工业界享有较高声誉。该会议在中国计算机学会的国际学术会议排名中,被推荐为人工智能领域的A类国际学术会议。本届AAAI会议将于2026年1月20日至1月27日在新加坡举行。

 

成果1:HyperSign: Saliency-Aware Spatial Graphs and Temporal Hypergraphs for Continuous Sign Language Recognition

作者:叶维乙,杨旭华(通讯),魏东,马钢峰,黄玉娇,李小薪

简介:

该成果为我院智能计算所杨旭华教授团队的研究成果,为计算机视觉领域连续手语识别方向的最新研究进展。论文的第一作者为硕士生叶维乙,通讯作者为杨旭华教授,其他作者包括博士生魏东、博士后马钢峰、黄玉娇老师以及李小薪老师。

该论文提出了一种面向连续手语识别的动态时空超图网络模型(HyperSign)。针对当前主流方法受限于传统卷积网络的局部感受野与时序模块对长程依赖建模低效的问题,HyperSign通过引入显著性空间图与时间超图相结合的创新视觉图神经网络,有效优化时空特征学习,从而缓解了模型难以捕捉跨区域和高阶动态语义的限制。具体而言,该方法在单帧空间建模方面融合图像块的特征复杂度与运动强度信息,动态量化其语义显著性,并以此为依据自适应地调整节点连接度,使图结构能够聚焦于手部和面部等信息密集区域;在时序建模上则利用利用可学习的聚类算法将时间窗口内语义相关的时空节点聚合为超边,从而显式捕捉单个手语手势动作中跨越多帧的高阶关联;展现出一种全新的连续手语识别特征学习范式。

 

成果2:Improving Region Representation Learning from Urban Imagery with Noisy Long-Caption Supervision

作者:张依媚,沈国江,宁凯丽,任桐炜,仇学博,王蒙蒙,孔祥杰(通讯)

简介:

成果为我院智能系统研究所沈国江教授团队的研究成果,为城市区域表示的最新研究进展。论文的第一作者为博士生张依媚,通讯作者为孔祥杰教授,其他作者包括沈国江教授、硕士生宁凯丽、南京大学任桐炜副教授、博士生仇学博以及王蒙蒙老师。

该论文提出了一种名为UrbanLN的跨模态预训练框架用于城市区域表示,旨在应对大语言模型(LLM)引导的城市图像分析中的两大挑战:1)难以实现细粒度城市视觉语义与长文本的有效对齐;2)LLM生成文本中的噪声导致次优的跨模态知识整合。为了解决第一个挑战,UrbanLN 引入了一种信息保留的延伸插值策略,以保持细粒度的语义对齐;为了解决第二个挑战,设计了一个分层噪声抑制机制,在数据层面采用多模型协作的自动化文本生成管道以缓解LLM中的幻觉问题,在模型层面引入基于动量的自蒸馏机制以提升模型在嘈杂条件下的跨模态鲁棒性。实验结果表明,UrbanLN在四个真实城市数据集的多个下游任务中均取得了卓越性能。

 

成果3CL-Guard: Defending DNNs Against Backdoors via Fine-Grained Neuron Analysis and Collaborative Dual-Network Learning

作者:肖杰,黄彧豪(通讯),高艳娇,刘爱竹,俞馨月,杨哲照,周乾伟,张帆(通讯)

简介:

该成果为我院智能计算所肖杰教授团队的研究成果,为人工智能安全与深度神经网络防护领域的最新研究进展。论文的第一作者为肖杰教授,通讯作者为博士生黄彧豪,其他作者包括博士生刘爱竹,硕士生高艳娇、俞馨月、杨哲照,周乾伟老师以及张帆老师。

该论文提出了一种面向深度神经网络后门防御的细粒度神经元分析与双网络协同学习框架(CL-Guard)。针对现有防御方法依赖粗粒度剪枝或正则约束、难以有效区分触发特征与正常语义特征、以及在有限干净数据下易导致性能退化的问题,CL-Guard 通过构建基于梯度导向的关键神经元选择机制与协同优化的双网络结构,实现了对潜在后门路径的精确识别与消除,从而在保持模型原始性能的同时显著提升防御鲁棒性。具体而言,该方法首先通过梯度贡献度分析与稀疏优化相结合的方式,动态筛选在后门激活中起关键作用的神经元并约束其连接权重,使模型聚焦于语义相关的正常特征空间;随后,引入主辅助网络协同学习机制,通过双网络间的特征互补与知识蒸馏,平衡后门抑制与任务保持,实现网络内部特征分布的自适应修复。该方法在多种数据集与多类后门攻击场景下均取得显著效果,展现出一种面向模型内部机制、兼顾精度与安全性的后门防御新范式。

 

成果4MaskAnyNet: Rethinking Masked Image Regions as Valuable Information in Supervised Learning

作者:洪景山,胡海根(通讯),张辉煌,周乾伟,赵丽

简介:

该成果为我院计算机视觉所胡海根教授团队的研究成果,为计算机视觉领域视觉表征方向的最新研究进展。论文的第一作者为博士生洪景山,通讯作者为胡海根教授,其他作者包括周乾伟老师、博士生张辉煌以及浙师大博士生赵丽。

该论文提出了一种基于掩码信息重利用的通用框架MaskAnyNet。针对当前监督学习中图像掩码方法普遍存在的两大核心问题:一是像素信息未被充分利用,导致有价值的上下文信息损失;二是可能导致目标的关键细节特征丢失,对细粒度任务产生负面影响。MaskAnyNet方法通过创新设计双视图分支架构,将传统掩码方法中被丢弃的像素区域重新组合为具有视觉意义的互补信息源,极大提高了像素信息的利用率,并增强了模型的全局-局部交互能力与边界感知能力。具体而言,该方法在传统掩码的基础上,通过在模型中引入一个额外的特征编码器,并从原始掩码图像中提取该掩码区域对应的原始图像信息,并根据其对应的空间位置进行重新排列组合,作为该特征编码器的输入源,与掩码主干分支进行协同学习,有效补充了局部细节和特征。该方法不仅保留了掩码的正则化优势,还通过重用机制极大地丰富了特征的多样性和细节保留能力。该方法在多种骨干网络以及视觉任务上均展现出性能显著的提升,为未来的视觉表征学习研究提供了新的思路与方案。

 

成果5PMPGuard: Catching Pseudo-Matched Pairs in Remote Sensing Image–Text Retrieval

作者:欧阳鹏翔,马青(通讯),王铮,白琮

简介:

该成果为我院视觉所白琮教授团队的研究成果,为多媒体信息处理领域的跨模态检索方向的最新研究进展。论文的第一作者为博士生欧阳鹏翔,通讯作者为马青副教授,其他作者包括王铮老师以及白琮教授。

该研究针对遥感图文检索中伪匹配对问题,提出了新型跨模态框架 PMPGuard(Pseudo-Matched Pairs Guard)。通过设计交叉门控注意力(CGA)与正负感知注意力(PNAA) 模块,动态筛选有效特征并区分真实与伪匹配信号,从而提升跨模态对齐的鲁棒性与准确性。在多个基准数据集上的实验表明,所提方法在在多个检索准确率指标上显著优于现有方法,展现出更强的泛化能力,为遥感智能检索分析提供了可靠的技术支撑。

 

成果6:TRT: Harnessing Tensor Ring Transformer for Hyperspectral Image Super-Resolution

作者徐宏辉、朱军伟、谷雨斌、全玥芊、方创杰、邱虹、郑建炜(通讯)

简介:

该成果由我院智能系统研究所郑建炜教授指导,为人工智能技术应用于遥感视觉领域的最新研究进展。论文的第一作者为徐宏辉博士后,通讯作者为郑建炜老师,其他作者包括硕士生朱军伟,博士生全玥芊、方创杰,以及校外合作人员谷雨斌、邱虹。

该成果围绕高光谱图像超分辨方向提出最新进展。论文将传统“低分辨高光谱+高分辨多光谱→高分辨高光谱”的融合问题,重构为RPCA(稳健主成分分析)风格的去噪任务,以此规避了以往深度展开网络在空间/光谱退化矩阵近似与反演上的繁琐建模;同时提出张量环 Transformer作为先验模块:把Q/K/V从N×d的表示映射到张量环因子域并以多线性张量环乘积代替点积注意力,使注意力计算复杂度由O(N2d)降至O(Nr2),在保留Softmax全局建模能力的同时吸收了线性注意力的高效性,实现解释性与效率的统一。

 

 

成果7M?VAE: Multi-Modal Multi-View Variational AutoEncoder for Cold-start Item Recommendation

作者:何川,刘永超(通讯),李强,洪春涛,钟文亮,姚信威(通讯)

简介:

该成果为群智感知与协同姚信威教授团队的研究成果,为多模态生成式模型在物品冷启动推荐领域的最新进展。论文的第一作者为我院博士生何川,姚信威教授与蚂蚁集团刘永超博士为共同通讯作者。其他作者包括李强老师,蚂蚁集团洪春涛、钟文亮。

该成果针对多模态冷启动物品推荐的痛点,提出了一种多模态多视角的变分自动编码器。通过构建基于所有模态的共同视图和基于单个模态的独特视图,实现多模态用户兴趣的有效建模。通过用户感知的多层次MoE架构,分别对模态层次和视图层次的特征进行针对性融合,有效地解决了冷启动推荐中多模态特征高效融合的问题。

 

硕果累累,可喜可贺!我们向取得这一优异成绩的全体师生致以衷心祝贺!

 

image.png