10月8日,,我校計算機科學學院碩士研究生麻斌豪以第一作者在人工智能頂刊Neural Networks發(fā)表論文Multi-domain Active Defense: Detecting Multi-domain backdoor poisoned samples via ALL to ALL Decoupling Training without clean datasets (2023, 168:350-362,;https://www.sciencedirect.com/science/article/pii/S0893608023005324?via%3Dihub),。孟博教授為唯一通訊作者,,我校為唯一署名單位。

多域主動防御方法框架,。 計科學院供圖
深度學習容易受到后門攻擊,,在這種攻擊中,攻擊者可以通過向訓練集中注入中毒樣本,,輕松地將隱藏的后門嵌入到訓練好的模型中,。許多用于檢測后門中毒攻擊的先進技術(shù)都是基于潛在可分性假設(shè)。然而,,目前的自適應中毒策略會大大降低“可區(qū)分行為”,,從而使大多數(shù)先前的先進技術(shù)有效性降低。此外,,現(xiàn)有的檢測方法對于多域數(shù)據(jù)集來說并不實用,,且可能會泄露用戶隱私,因其需要并收集干凈的樣本,。
為解決上述問題,,該篇論文提出了一種不使用干凈數(shù)據(jù)集的多域主動防御方法。此種方法可以生成不同域的干凈樣本,,并利用干凈樣本逐輪解耦神經(jīng)網(wǎng)絡(luò),,從而解除特征和標簽之間的關(guān)聯(lián),使后門中毒樣本更容易被檢測,。
據(jù)悉,,Neural Networks 是專注于神經(jīng)網(wǎng)絡(luò)和深度學習研究的學術(shù)期刊。該期刊發(fā)布關(guān)于神經(jīng)網(wǎng)絡(luò),、深度學習,、機器學習和相關(guān)領(lǐng)域的原創(chuàng)研究論文、綜述文章和技術(shù)報告,,在人工智能領(lǐng)域具有較高的國際影響力,,是中科院SCI一區(qū)TOP期刊。