用AI抓明星逃税,我發現了“幾個億”的商機_風聞
邓安令THU-2021-05-03 03:07
爆鄭爽偷税億元,我發現了 AI 金融“幾個億”的新商機
雷鋒網2021-05-02
搬磚間隙摸魚衝浪,突然發現所有社交平台被“鄭爽日薪 208 萬元”刷屏了:
女藝人鄭爽的前男友張恆爆料,鄭爽通過陰陽合同在《倩女幽魂》項目中獲得收入 1.6 億元,按 77 個工作日計算,日薪超 208 萬元。
那按月薪 1 萬來算,咱們大概要工作 17 年才能賺到爽子一天的錢(……)

你以為我還會在乎嗎,這個數字已經傷不到我了,我在大潤發殺了十年的魚,我的心已經和我的刀一樣冷了。
根據張恆的描述來估算,爽子這一年勞逸結合能賺 6.4 億。
……BATJTMD 看了都直呼好傢伙

相比之下,逛超市不付款、對寵物狗不負責之類的瓜好像都是灑灑水了……
重點是,在張恆的“雷神之錘”五分鐘小視頻裏,各種證據還錘了鄭爽涉嫌“偷税漏税”“陰陽合同”:

網友怒生一計,建議以後明星的實績就以納税額來算。
什麼專輯銷量電影票房品牌代言雜誌封面,都不如為國繳税來得直接√
虛假的打工人還在被明星的高薪水深深刺痛,但真正的打工人,已經發現了一個巨大的商機。

作為本行業資深 Top 500000 的一位觀察者,我敏鋭地意識到:
AI 用於反偷漏税,用於審查陰陽合同,這不就是現成的 AI 金融應用場景嗎!

這要是能安排上,前面的按税排番,肅清娛樂圈風氣,豈不是指日可待?
但是不是真的可行,當然還是要大膽假設小心求證。

我們與數家 AI 金融公司簡單聊了聊,發現這類技術解決方案做得並不算多,只是有些風控方案中會考慮納入税務數據作為參考維度。
真正做 AI + 反偷漏税的玩家,似乎十分低調。
一位較著名的杭州 AI 獨角獸透露,他們與杭州某區曾經合作搭建税務平台,由他們提供部分模塊的建設,但他們也強調:
“這事兒還是得政府牽頭完成。”
啊這,難不成這事兒很有難度?
相關人士表示:
“我認為這沒有任何技術難度,但難就難在税務數據的打通,和税務模型的構造上。常見的避税手段就這麼多,可以拿足夠多的財務報表去訓練模型,去計算相關結果有沒有偏離財税比率。我覺得這沒有什麼太強的科研要求。”

如果拿不到政府機構內部的數據,用外部數據來操作,可行嗎?
技術大佬:倒也沒有很可行。
一位不怎麼知名的機器學習工程師,就跟我們詳細地掰扯了一下 AI + 反偷漏税的應用邏輯:
AI 本質上能做的是學習相關性。
那對查偷税漏税來説,可以尋找某些數據指標和真實收入之間的關聯性,預測大概能掙多少錢,然後實際報税收入沒那麼多就是一個懷疑的理由。
從最單純的情況開始 ——
假設某平台上一億粉絲、每日一億互動的明星一年拍 2 部戲有 10 億收入,2 千萬粉絲、2 億互動的可以有 1 億收入。
抓取的數目項目越多,比如囊括更多平台更多數據、囊括每年有多少廣告合作,對實際收入的預測就有可能越準確。

▲ 榜單很多,不要問我哪個才是最準的
但這仍然是很難的:比如公開的數據並沒有標準格式、需要大量的清洗整理;
比如娛樂圈的市場報價,對外行人來説,也根本就不是公開的。
另一方面,明星每年實際報了多少税,只有税務局自己知道;
這些報税數據,也本來就應該屬於個人隱私,所以也只有税務局自己建立一個這樣的系統,才能拿到這一頭的數據。
再接下來,即便模型顯示預測的收入和實際報税收入有差距,也還是一個很弱的證據,為了能具體確認數額和處罰,還是需要人工找到具體的偷漏税的合同。
説到底,就算真有這樣的系統,幫助也不是很大吧。

還有業內人士接着吐槽數據打通問題:
中國證券公司系統發展二十幾年了,交易所之間、證監會和交易所之間的數據都還沒打通呢,估計税務部門也是一樣。
此前也有報道:
目前,各省的數據庫都是相互割裂的(企業在全國各地有分支機構的逃税更容易),在 AI 系統下,政府所有的數據庫,包括財產、商品、國際貿易、商業登記等數據信息,將會連接互通。
比起技術本身實現的難度,對於税務數據的來源、歸屬和打通,其實才是問題的關鍵吧。

不過之前 AI + 税務有沒有呢?其實是有的。
在國外,這種應用已經紅紅火火地用起來了,比如 Intuit 就是一家智能財税軟件巨頭,C 端拳頭產品 Turbo Tax 就是幫用户準備報税。
但説實話國情差異比較大,外國要填的税單複雜到三天三夜都説不完,這部分的詳細介紹我們有空再説。

具體到 AI + 税務的應用方向,之前就已經有人梳理出了這麼幾類:
第一種,幫税務人員做表,重複的流程都替代掉。
第二種:掃描税務報告。
這就與 OCR(光學字符識別)有關了,OCR+AI 這對組合拳可以讓文本內容掃描並上傳至數據庫內,這不比翻紙質文件香嗎?
第三種:幫税務人員看文檔。
這個大致也涉及語義理解方向,比如分類憑證和文檔,從中提取關鍵數據,像是企業營收,應收應付款項,税單折扣額度之類的。

前三種可能算是青銅級別的難度,其實最近兩年大熱的 RPA 已經在做類似的工作了,財税也正好是 RPA 在金融領域規模化部署跑得最快的一個場景。
白銀級別的,就上升到預測税負、分析税收趨勢。
黃金級別的,就是發現逃税、漏税,提高税務領域透明度的水平了。
比如藉助機器學習算法,快速識別出大型數據集內包含的異常條目;
比如基於多種指標檢測欺詐活動,例如對方的就業情況、以往是否曾經接受審計,以及與非法收入來源相關的蛛絲馬跡。

其實早在 2019 年底,就有報道講過 AI 反偷税漏税了:
AI 系統已嵌入到金税系統的核心,後者是國家税務總局使用的軟件,是國家金税工程中開具國税增值税發票的開票子系統。
據瞭解,該 AI 系統由北京金税的主要承包商航天信息股份有限公司,與哈爾濱工業大學和北京郵電大學的科學家合作開發。
航天信息旗下的航天金税,就是國家重點工程“金税工程”的北京地區服務商。
給大家畫幾個重點:
可以標記超過 95%的違法行為,包括一些大多數税收徵收者不熟悉的新手法;
已經在東部幾個城市進行試點,取得了“非常積極正向”的效果;
過去三年(那就是 2016~2019 期間?),有近 30 萬税務稽查人員,一直在參與調試;
這套系統能自動升級算法,保證與最新的税收法規保持一致;
能連通政府的所有數據庫,税務稽查更高效;
AI 通過交叉檢查,從中找出虛假數據,做出標記,最終查出逃税;
不僅是企業逃税,個人逃税也在調查範圍。

報道舉了兩個例子:
1. 一家建築公司在報税時,為了增加抵税,誇大了水泥的價格。AI 能把公司的報價,與當時的市場均價比較,數據異常則做出標記。
2. 有的企業為了減少應税收入,會以不合理的低價格,將產品出售給關聯公司。數據連通後,公司的分支機構,產品的市場價格,都會被自動檢測出來,然後被標記。
當時南華早報的報道里還説到,研發人員表示,范冰冰那樣的九億事件將會成為歷史!
但那個時候鄭爽已經過上了日薪 208 萬的快樂日子。