我院硕士研究生论文被国际顶刊IEEE TIFS录用

时间:2025-07-07作者:付皓文章来源:世俱杯买球官网网站浏览:11

世俱杯买球官网网站世俱杯买球官网网站师生撰写的论文《Contrastive Learning and Feature Space Tactics: A Dual Approach to Strengthen Backdoor Attacks》日前被IEEE Transactions on Information Forensics and SecurityIEEE TIFS)接收。IEEE TIFS是信息安全领域最具影响力的国际顶级刊物之一,中国计算机学会(CCF)推荐A类期刊,中国密码学会(CACR)推荐A类期刊,中科院一区TOP期刊。论文研究由2024硕士生付皓(第一作者)在李熔盛老师(通讯作者)的指导下完成,论文作者还包括澳大利亚迪肯大学的Ming Liu老师。

论文的研究内容为文本后门攻击,是人工智能安全领域的重要研究方向。随着深度学习模型的广泛应用,后门攻击作为一种隐蔽且危险的安全威胁,正日益受到学术界与工业界的关注。

当前先进的文本后门攻击方法通常利用语法结构或文本风格作为隐蔽的触发器特征,虽然具备较强的隐蔽性,但在攻击效果上表现不佳,尤其在面对基于微调策略的防御手段时往往难以奏效。因此,该论文提出了一种创新的多任务文本后门攻击框架CLaFSContrastive Learning and Feature Space Tactics),旨在提升针对预训练语言模型的文本后门攻击性能。

作者提出了两种增强文本后门攻击性能的方法:监督对比学习与特征空间隔离任务。其中,监督对比学习通过增强模型对中毒样本的学习能力,借助参数共享机制显著提升了后门攻击的有效性;而特征空间隔离任务则通过将中毒数据与其他类型数据在特征空间中分离,增强了模型对后门触发特征的敏感度,从而有效降低模型对后门攻击的抵抗力。此外,作者还提出了一种创新的“零中毒攻击”(Zero Poison Attack)方式,无需直接污染目标任务的训练数据,即可间接实现后门嵌入,进一步提升了攻击的隐蔽性与适应性。

实验结果显示,所提出的攻击方法在多种特殊攻击场景下均展现出优异的性能表现,不仅显著提升了不可见文本后门攻击的成功率,还在面对微调防御策略时保持了良好的泛化性与鲁棒性。


Baidu
sogou