揭秘阿里打假AI大腦：186個國家圖書館，1 AI=50000人類，獲創新大獎_風聞

量子位-量子位官方账号-2019-08-14 16:31

2019-08-14

李根發自廈門

量子位報道 | 公眾號 QbitAI

“令人震驚的是，在打假這方面，美國竟然遠遠落後！”一個月前，美國司法委員會副主席、共和黨參議員道格·柯林斯痛陳美國被假貨所困的問題，其話言猶在耳，近日阿里打假技術又拿下國內高規格的技術大獎。

8月9日，由工信部、公安部及網信辦三部委指導主辦的“中國人工智能高峯論壇”在廈門召開，經過層層評選，阿里巴巴知產保護科技大腦被三部委評為“人工智能創新之星” 。

知識產權保護所指，更喜聞樂見的叫法就是打假。而阿里的知產保護科技大腦是一套阿里20年間積累的海量線上線下假貨特徵庫、打假經驗聚合而成的算法技術系統，獨創“安全AI”大腦是核心。

這套系統24小時自動運轉，96%的疑似侵權鏈接在發佈的那一剎那就已被秒殺。在過去3年，阿里已使用這套技術協助全國31個省份、227個區縣的警方抓獲製售假嫌疑人4439人，搗毀製售假窩點4289個。

從美國議員點贊到國內技術大獎，可以説時節已至，阿里打假正進入爆發性收穫階段。量子位也瞭解到這背後的安全AI運作之力、創新之功，接下來為大家一一揭秘。

1 AI 大腦=5 萬人類

知產保護科技大腦，就是誠心和技術創新的集大成產品。

該“大腦”完全由阿里自主研發，已經被廣泛應用於阿里生態內外，對假貨、山寨、侵權盜版等進行偵測和打擊。

而且作為一支上崗AI，各方面實力，不僅比人類幹得好，而且很多能力人類幹不了。

阿里方面公佈了一系列驚人數據表現：

如果人工查看1張圖片的信息需要10秒鐘，那麼5萬人同時工作的效率才能勉強趕上“知產保護科技大腦”掃描甄別圖片的速度。淘寶天貓平台每日新發商品量以千萬計，如果人工巡查，138889人工作1天才能把這項工作完成。

阿里安全圖靈實驗室負責人薛暉透露，這套系統的樣本數據總量相當於186箇中國國家圖書館藏量，僅累積的打假圖片樣本量就超過137億張，用0.3毫米的標準相紙打印疊加後高達4110千米，是世界最高建築迪拜塔的4964倍，約等於464個珠穆朗瑪峯。

驚人的效果背後是阿里在安全場景裏不斷進化技術力量所鍛造的“安全AI”風控體系。

安全AI如何服務知識產權保護？

所謂安全AI，是指安全場景中進化出的AI，擁有更強、更多元化的能力；與當前通用AI的理念不同，阿里安全更注重在業務安全領域垂直縱深的技術積澱，開發出適應更多安全場景的新一代AI，讓傳統的安全問題找到新的AI解法。阿里在今年年初提出這一全新理念，稱其將成為未來網絡安全問題的核心解法。

據悉，阿里知產科技大腦的秘密在於四大智能核心引擎，涵蓋阿里上百項自主研發的安全AI技術。分而解之，涉及感知引擎、認知引擎、決策引擎和計算引擎。

實際也是通用人工智能（AGI）必不可少的四大引擎，只是阿里垂直為打假服務。

從項目申報説明裏，也能尋得宏觀架構脈絡。

**感知引擎：**核心技術是計算機視覺技術及語音識別技術，是整個系統的感官系統，是對象識別的基礎，為形成後續一系列處理動作邁出第一步。

包括，用於開店身份認證環節的人臉識別、聲紋識別、活體檢測等生物識別技術；用於開店資質核驗環節的證件識別、篡改檢測技術；用於線上商品識別的商標檢測、物體檢測、光學字符識別技術；用於營銷環節檢測的廣告圖片分析和視頻直播監測技術，以及用於原創作品保護的多媒體檢索和圖像水印技術等。

正是“感官系統”精準的語音、圖像、音頻、視頻感知能力，整個系統才能在數億複雜數據中準確識別出需要保護和防禦的對象，進行下一步處理。

**認知引擎：**核心技術是自然語言處理技術。

認知引擎是系統的“翻譯官”，讓機器懂得文字的意思、人類聲音的含義，以及人們動作的性質，從而判斷善意\惡意、危險\安全。

具體包括針對海量商品結構化與非結構化數據構建的知識圖譜技術；面向海外電商的多語言分析和機器翻譯技術，針對外部反饋的評價、輿情進行識別的語義分析技術；以及融合多模態信息，對商品的全面認知和理解的技術。

第三，**決策引擎：**核心技術包括深度學習和強化學習兩塊，用來解決現實中的複雜決策問題。

它是系統的“軍師”，決定了系統該如何動作，如何更合理有效地作出最佳應對。例如當面臨商家實時博弈、信息內容的變異，以及黑產的惡意攻擊時，在全局視角下做出更有利的決策。

最後還有計算引擎，包括實時指標計算系統、分佈式異構計算系統、和大規模圖神經網絡系統。

這是打假AI大腦的發動機，它強大的性能保證了系統在數千併發、數十億數據面前坦然自若、精準高效。

計算引擎背後，支撐的是阿里雲機器學習平台 - PAI 3.0。

它可以實現單任務支持上千worker併發訓練，並支持5k+超大規模異構計算集羣，保證全天候監控數十億商品異常情況，以及對經營者行為的全方位監督。

台上一分鐘，技術20年功

值得一提的是，四大引擎架構宏觀，但背後每一項技術積累，都是工程師們日夜苦功的結果。

值得一提的是，打假AI大腦是阿里安全“安全AI”落地應用場景之一。阿里在高風險、強對抗的場景中不斷進化AI的力量，通過小樣本學習、多模態、自監督學習等新技術的持續應用，在內容安全、新零售安全、交易安全等百餘場景中持續應用，其凝聚着阿里安全圖靈實驗室在AI領域超過10年的技術積澱，實現水滴石穿。

從最近阿里安全圖靈實驗室在人工智能頂會的論文中，不難發現其功力所在。

這是阿里發表於ECCV Workshop 2018的論文，核心分享了其在視頻分析領域的技術進展。

也是阿里從視頻中識假打假，保護原創的秘訣所在。

當前業內通行的視頻分析，往往先預訓練CNN網絡提取特徵分類，其後採用循環神經網絡（RNN、LSTM）進行序列建模。

但視頻的特徵序列一般較長，且含有多級結構（hierarchical data structure），即一個視頻包含幀、鏡頭、場景、事件等。

而且幀與幀、鏡頭與鏡頭間的關係十分複雜，不僅僅是前後幀的順序關係，通過一般的序列建模方法，RNN無法表達如此複雜的關係，建模效果較差。

因此阿里研究團隊通過深度卷積圖神經網絡（DCGN）對視頻的幀、鏡頭、事件進行多級的建模，逐漸地從幀級、鏡頭級，一直到視頻級進行抽象，從而獲得視頻全局的表達，進而進行分類：

最後方法在youtube8m數據集上驗證後，效果相對其他經典的序列建模方法，都有提升。

論文傳送門：https://arxiv.org/abs/1906.00377

還有自然語言處理領域的進展，同樣是知產保護科技大腦的關鍵技術。

阿里安全圖靈實驗室入選IJCAI 2019的文章，主題是面向對象的情感分析，主要目標是挖掘出評論對象，同時判斷情感表達的極性。

一般而言，很多對於商品質量描述的蛛絲馬跡，會隱藏在用户對商品的評論中，卻很難從商品本身中發現問題，這也是NLP技術能夠施展拳腳的場景。

論文中提出的方法，通俗來説是利用全局信息、結合上下文語境去識別情感對象，而不再是預測每個字對應的序列標籤。

這種方法基於詞塊方法，提出更簡單高效的聯合模型，同時抽取情感表達對象以及判斷其情感極性。

具體步驟上，首先對評論語句中的所有候選詞塊進行向量表示，然後提出了一種基於詞塊的注意力機制來預測詞塊對應的標籤和極性。

最後公開數據集評測對比後，證明比現有方法表現更好。

另一項體現場景挑戰和技術水平的是安全場景特有的對抗性問題。

售假賣家往往會通過改變“標題”和“描述”以躲避傳統規則和模型的識別，但這並非完全無跡可尋。

混淆語言是一種被用於在對抗交流場景下實現規避檢測的技術手段。

對抗交流場景包括敏感信息傳播、負面情感表達、秘密行動策劃以及違法交易等。混淆語言的實現方式通常是在原始文本里進行變異詞的替換。

監管機構在識別此類文本時，需要根據一組關鍵詞進行掃描過濾。儘管引入了一些語義擴展技術，但是由於文本中的歧義性以及變異的無邊界，導致識別此類文本的準確率和召回率都十分有限。

阿里在WWW 2019上發表的論文，集中披露了該方向上的核心進展。

該論文的主要思路是將混淆語言識別轉化為一個文本匹配任務，即每條待檢測信息，是否匹配一個掃描關鍵詞，並且同時整合了文本信息的文本表示和視覺表示。

這裏的視覺表示指的是文字自身的視覺效果，而不是信息中的圖片，主要是因為在進行文本變異混淆時，經常會出用一些看起來像的字符進行替換，這種變異導致了混淆後的內容在語義上可能已經跟原始內容沒有任何關聯，但是從視覺效果上卻可以產生聯繫。

阿里的模型利用BiLSTM對文本特徵進行表示，通過基於模板匹配的方式對視覺特徵進行表示，通過多模態的整合，可以比傳統方法表現出更高的準確率和召回率。

另外就是結合圖像視頻和自然語言處理的多模態任務解決方法。

論文發表於ICASSP 2019，其中列舉的任務也頗有意思：通過一段文本描述，自動地編輯源圖像使其符合給出的文本描述，從而簡化圖像編輯流程，是一種基於文本的圖像編輯方法。電商網站中的商品本身就是文字與圖片的混合內容，因此可以期待這項技術可以加強對商品內涵的理解，更有助於發現假、劣商品。

感興趣的盆友可移步傳送門：http://arxiv.org/abs/1903.07499

最後再介紹一項業內sexy，且對打假AI貢獻不小的技術進展：小樣本學習。

假貨問題（安全問題）中最頭疼的點，莫過於對新出現的風險缺乏足夠訓練的樣本，導致諸多優秀機器學習算法望而卻步。

在CVPR 2018上，阿里安全圖靈實驗室團隊，圍繞業內前沿的“零樣本視頻檢索”挑戰，給出解決方案。

視頻檢索，通常要在文本和視頻之間提取跨模態相關性，需要基於內容匹配。

但阿里的方法之不同，在於提出了一種內容無關的方法，通過雙重深度編碼網絡來將視頻和文本編碼為各自模態的密集式表徵。

並且雙重編碼概念簡單、切實有效，還可以端到端學習。

在三個基準數據集MSR-VTT、TRECVID2016、2017上實驗後，證明阿里提出的零樣本視頻檢索方法已達到目前最佳。

論文傳送門：http://arxiv.org/abs/1809.06181

就在最近的機器學習頂會IJCAI-2019上，阿里安全成功舉辦了第一屆AAAC競賽（Alibaba Adversarial AI Challenge）以及AIBS研討會（Artificial Intelligence for Business Security），旨在探索麪臨對抗攻擊時，如何解決AI模型的安全性問題。競賽和會議吸引了來自24個國家和地區的2000多支隊伍參與，過程中湧現出不少新思路和新方法，極大地推動了這一領域的發展。

“AI發展趨勢是一定的，但AI應用來解決安全問題時並不能生搬硬套，需要根據實際場景進行AI的技術升級，”薛暉在今年年初的公開採訪中就指出，安全會成為未來AI開發的最大挑戰， “安全AI”會成為未來網絡安全問題的新解法，也將在2019年迎來爆發期。

如今阿里“知產保護科技大腦”的成功實踐不斷得到行業乃至全球的認可，正印證了這一斷言。

阿里打假AI，用技術解決社會問題

打假AI大腦成功，幕後原因並不難分析。這也會是阿里各項業務在AI時代裏還會更繁榮的保證。

打假作為綜合因素導致的社會問題，利用AI等技術實現其實並非易事，沒有對比，可能就難看出誠心誠意。

比如美國電商巨頭亞馬遜，其實也在今年新推出一項名為“Project Zero”的打假防偽項目，通過與品牌方合作，打擊消除假貨。

但在具體技術機制上，就目前披露情況而言，相較阿里的打假AI大腦，技術上稍遜一籌。

因為亞馬遜的打假AI，還需要合作品牌提供logo、商標和其他信息，甚至讓品牌方利用工具標記並禁止仿冒品。

仍更多依賴監督學習的方式，自動化程度和AI通用能力還相對不足，對於阿里無監督、小數據學習和系統性大腦，技術能力和挑戰，高下立判。

所以也難怪美國眾議院司法委員會副主席道格·柯林斯在調研了亞馬遜、eBay、阿里在內的電商平台後，給出評價：“阿里巴巴的打假政策和項目比任何美國同行都有效得多。”

阿里之道の一以貫之

最後，阿里的做事方式，依然值得關注。

宏觀層面來看，知產保護科技大腦，依然是又一次阿里式創新的成功。

打假難題，源頭在社會發展階段和人性劣根處。面臨的挑戰，跟電商、支付、物流、計算和自主芯片，本質相同，困難無差。

但阿里之道一以貫之，為打假而生的AI大腦系統，依然是淘寶天貓、支付寶、阿里雲，菜鳥和平頭哥模式的延續：

技術驅動，打造系統平台，從根本上解決問題。而且俠之大者，未來也會兼濟天下，賦能各行各業甚至各國，能力所至，皆受其益。

會有那麼一天，天下再無假貨嗎？夢想或許還是可以有的。

畢竟 AI can do，Ali is doing……

也歡迎你説説還有哪些AI技術，可以用到打假中^_^