提升AI魯棒性是識別深度偽造的有效途徑
深度偽造(Deepfake)是深度學(xué)習(xí)(deep learning)和偽造(fake)的合成詞,最初是指基于深度學(xué)習(xí)的人像合成技術(shù),隨著技術(shù)進(jìn)化,深度偽造已經(jīng)發(fā)展到對視頻、聲音、文字和微表情等多模態(tài)視頻偽造的欺騙技術(shù)。
由于深度合成的圖像、視頻、音頻、文本等內(nèi)容制作成本低、操作簡單、逼真程度高,被大量用在網(wǎng)絡(luò)黑產(chǎn)對銀行的身份欺詐攻擊;另一個方面,機(jī)器學(xué)習(xí)往往需要大量的高質(zhì)量訓(xùn)練數(shù)據(jù)來提升模型的準(zhǔn)確性,但是AI在數(shù)據(jù)量有限的情況下,其性能就會受到很大局限,對形式多樣的深度偽造內(nèi)容的甄別難度極大。
對抗訓(xùn)練可以顯著提升模型的魯棒性
對抗訓(xùn)練作為抵御對抗攻擊的有效方法,可以在模型訓(xùn)練中直接加入對抗樣本進(jìn)行學(xué)習(xí),得到一個“增強模型”,從而防御對抗樣本和偽造樣本,提高AI對于新數(shù)據(jù)、新場景的泛化能力。目前國內(nèi)人工智能領(lǐng)域在魯棒性研究方面已經(jīng)取得了一些成果,并可應(yīng)用在金融領(lǐng)域客戶身份識別、證照鑒別、反欺詐、模型評估等場景中。
根據(jù)擾動的類型來選擇相應(yīng)的技術(shù)路線
銀行的技術(shù)使用者在應(yīng)用AI進(jìn)行語音、文本或圖像的鑒別時,需要區(qū)分?jǐn)_動的類型是善意還是惡意的,從而可以選擇相應(yīng)的技術(shù)路線來提升AI的可信度。
善意的擾動是由于客觀環(huán)境原因造成原始數(shù)據(jù)質(zhì)量不佳造成的,導(dǎo)致AI的模型決策產(chǎn)生了偏離和錯誤。在銀行實際應(yīng)用場景中,智能客服需要面對不同的客戶、不同光照環(huán)境的照片、不同的語言表達(dá)習(xí)慣等,當(dāng)這些待處理的數(shù)據(jù)發(fā)生了微小變化后,缺乏魯棒性的AI識別能力和精確度就會明顯下降。這種情況下,建議通過技術(shù)手段來改善圖像本身的質(zhì)量,將原始數(shù)據(jù)轉(zhuǎn)化為模型可以理解的格式后再進(jìn)行識別;另外,在模型訓(xùn)練中將知識驅(qū)動和數(shù)據(jù)驅(qū)動結(jié)合起來,通過抽取、表達(dá)后協(xié)同大量數(shù)據(jù)進(jìn)行計算,形成更為精準(zhǔn)的模型。
惡意的擾動則是故意通過深度合成偽造圖像,或是在真實圖像中添加特定噪聲產(chǎn)生對抗樣本,對銀行進(jìn)行的欺詐攻擊。面對這種類型的擾動,建議技術(shù)使用者選擇AI對抗攻防工具進(jìn)行偽造樣本的檢測,識別圖像是否被篡改,建立合適的風(fēng)控策略進(jìn)行實時預(yù)警或攔截;在選擇偽造檢測產(chǎn)品時,需要考量產(chǎn)品對不同類型對抗樣本的攻擊拒絕率和準(zhǔn)確率,以及數(shù)據(jù)類型的兼容性、運算速度等性能方面的表現(xiàn),結(jié)合不同業(yè)務(wù)場景的風(fēng)控要求來進(jìn)行綜合評估。