目前,聯(lián)邦學(xué)習(xí)開(kāi)源技術(shù)形成兩大發(fā)展方向:專(zhuān)注于開(kāi)發(fā)聯(lián)邦學(xué)習(xí)算法模型;專(zhuān)注于開(kāi)發(fā)融合安全協(xié)議。以所屬機(jī)構(gòu)業(yè)務(wù)出發(fā),商用為主的聯(lián)邦學(xué)習(xí)開(kāi)源項(xiàng)目?jī)H在某類(lèi)機(jī)器學(xué)習(xí)功能中引入安全協(xié)議實(shí)現(xiàn)安全聯(lián)邦學(xué)習(xí),更加關(guān)注結(jié)合機(jī)構(gòu)技術(shù)生態(tài)結(jié)合而非多樣化的技術(shù)應(yīng)用。FATE與Rosetta以聯(lián)邦學(xué)習(xí)安全性與性能出發(fā),注重聯(lián)邦學(xué)習(xí)的整體解決方案。研究為主的聯(lián)邦學(xué)習(xí)開(kāi)源項(xiàng)目則從聯(lián)邦學(xué)習(xí)的各個(gè)層面探討技術(shù)實(shí)現(xiàn)的可能性。通過(guò)對(duì)開(kāi)源與技術(shù)特性的研究,易觀分析認(rèn)為,CTO在選擇開(kāi)源項(xiàng)目時(shí),要基于自身業(yè)務(wù)發(fā)展階段和自有開(kāi)發(fā)團(tuán)隊(duì)實(shí)力,選用具有相應(yīng)功能、安全性、可擴(kuò)展性的開(kāi)源項(xiàng)目。
聯(lián)邦學(xué)習(xí)開(kāi)源項(xiàng)目整體發(fā)展良好,但項(xiàng)目之間存在較為明顯的差異性。協(xié)議方面,除PySyft & PyGrid外均采用對(duì)商業(yè)化影響較小的協(xié)議。代碼開(kāi)源度方面,PySyft&PyGrid、TF-Federated和FedML等研究型開(kāi)源項(xiàng)目相對(duì)較高,能夠?qū)Φ讓铀阕?、算法和安全協(xié)議等代碼實(shí)現(xiàn)開(kāi)源開(kāi)放。FATE、MindSpore Federated、TF-Federated、PySyft&PyGrid等文檔完整性較高的項(xiàng)目普遍活躍程度也較高。表1:聯(lián)邦學(xué)習(xí)開(kāi)源項(xiàng)目之開(kāi)源特性對(duì)比

總體來(lái)看,研究型項(xiàng)目的開(kāi)源社區(qū)建設(shè)優(yōu)于商業(yè)項(xiàng)目,但FATE作為國(guó)內(nèi)開(kāi)源商業(yè)項(xiàng)目的代表,從開(kāi)源社區(qū)Pull Request情況、commits數(shù)量、版本迭代速度、代碼更新頻率、貢獻(xiàn)者數(shù)量和影響力等指標(biāo)來(lái)看,均呈現(xiàn)出良好健康的態(tài)勢(shì)。在技術(shù)實(shí)現(xiàn)上,聚焦于商用化的聯(lián)邦學(xué)習(xí)項(xiàng)目更加注重功能的封裝,實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)的快速應(yīng)用;聚焦于研究領(lǐng)域的開(kāi)源項(xiàng)目則通過(guò)拓展AI框架底層接口,實(shí)現(xiàn)功能高度自定義。
表 2:聯(lián)邦學(xué)習(xí)開(kāi)源項(xiàng)目之技術(shù)特性對(duì)比

注重結(jié)合自身技術(shù)生態(tài)且聚焦商用的聯(lián)邦學(xué)習(xí)開(kāi)源項(xiàng)目普遍在部署應(yīng)用方面給予較強(qiáng)的支撐,為聯(lián)邦學(xué)習(xí)的應(yīng)用快速落地做出了有效的嘗試,但實(shí)現(xiàn)的聯(lián)邦學(xué)習(xí)功能較為單一。FATE在開(kāi)源技術(shù)上為聯(lián)邦學(xué)習(xí)大規(guī)模應(yīng)用提供了很好的范例,Rosetta也為聯(lián)邦學(xué)習(xí)前沿技術(shù)商業(yè)化提供了很好的支撐,但其開(kāi)源的1.0代碼版本尚不能支持聯(lián)邦學(xué)習(xí),其自研Helix協(xié)議具有較高參考價(jià)值。研究為主的聯(lián)邦學(xué)習(xí)開(kāi)源項(xiàng)目普遍從技術(shù)的快速實(shí)現(xiàn)與高度自定義兩方面出發(fā),對(duì)高層接口進(jìn)行封裝并對(duì)底層接口進(jìn)行擴(kuò)展,并注重對(duì)模型性能的評(píng)價(jià)。同時(shí),在技術(shù)路線上,研究為主的開(kāi)源項(xiàng)目更加注重從算法策略與算子維度加強(qiáng)模型性能,僅PySyft注重安全協(xié)議的應(yīng)用。在部署方面,F(xiàn)edML在邊緣設(shè)備上的部署較有參考價(jià)值。功能集成度高的商用型開(kāi)源項(xiàng)目利于快速部署與應(yīng)用以FedLearner與EFLS為代表的廠商可以快速實(shí)現(xiàn)云部署;FATE功能全面,且給予多場(chǎng)景的部署支持;以MindSpore,PaddleFL為代表的項(xiàng)目,高度集成于自研AI框架中,可以實(shí)現(xiàn)快速部署,且支持在移動(dòng)端部署。商用型項(xiàng)目的安全協(xié)議支持度、功能全面性與學(xué)習(xí)成本互為掣肘
安全協(xié)議支持方面,商用為主的聯(lián)邦學(xué)習(xí)開(kāi)源項(xiàng)目普遍支持差分隱私,但在模型訓(xùn)練方面差分隱私對(duì)模型造成的影響不可控。多方安全計(jì)算與同態(tài)加密對(duì)計(jì)算資源與通信資源的要求較高,實(shí)現(xiàn)成本高。功能方面,除FATE外,商用為主的聯(lián)邦學(xué)習(xí)開(kāi)源項(xiàng)目普遍實(shí)現(xiàn)功能較為單一,難以滿(mǎn)足復(fù)雜或多樣化產(chǎn)品的應(yīng)用。但是,盡管FATE給予較強(qiáng)的部署支持,但學(xué)習(xí)成本高,部署存在一定難度,且在云部署方面目前對(duì)Spark的支持還在開(kāi)發(fā)中。研究型開(kāi)源項(xiàng)目的高度自定義特性可以滿(mǎn)足自身業(yè)務(wù)發(fā)展需求
研發(fā)能力較強(qiáng)的團(tuán)隊(duì)可以采用研究為主的聯(lián)邦學(xué)習(xí)開(kāi)源項(xiàng)目,實(shí)現(xiàn)底層技術(shù)研發(fā),達(dá)到功能的高度自定義,滿(mǎn)足更加多元的業(yè)務(wù)應(yīng)用場(chǎng)景需求。開(kāi)發(fā)成本與安全性是選擇研究型項(xiàng)目的關(guān)注重點(diǎn)
對(duì)研發(fā)能力較弱的團(tuán)隊(duì)而言,研究型項(xiàng)目的開(kāi)發(fā)成本較高。同時(shí),從安全性角度出發(fā),研究型項(xiàng)目有復(fù)雜的技術(shù)供應(yīng)鏈,存在安全漏洞與惡意攻擊的風(fēng)險(xiǎn)。
未經(jīng)易觀分析授權(quán),嚴(yán)禁轉(zhuǎn)載、引用或以任何方式使用易觀分析發(fā)布的任何內(nèi)容。經(jīng)授權(quán)后的任何媒體、網(wǎng)站或者個(gè)人使用時(shí)應(yīng)原文引用并注明來(lái)源,且分析觀點(diǎn)以易觀分析官方發(fā)布的內(nèi)容為準(zhǔn),不得進(jìn)行任何形式的刪減、增添、拼接、演繹、歪曲等。因不當(dāng)使用而引發(fā)的爭(zhēng)議,易觀分析不承擔(dān)因此產(chǎn)生的任何責(zé)任,并保留向相關(guān)責(zé)任主體進(jìn)行責(zé)任追究的權(quán)利。