説起來你可能不信，大夥可能都被驗證碼白嫖過了_風聞

差评-差评官方账号-2020-08-02 07:59

2020-08-02

本文原創於微信公眾號：差評作者：差評君

只要上網衝過浪的人，基本上就沒有不知道驗證碼這玩意的。這些年來，驗證碼的形式也被玩得越來越花。有不少的網友吐槽，沒有一些知識儲備，連驗證碼都要看不懂了。

差評君的驗證碼成績也並不理想，特別是在遇到滑動式驗證碼這種細緻活兒時，就經常因為手抖而前功盡棄。

還有這種高數答題式驗證碼，沒有點數學知識積累的用户，基本上就只能行法式軍禮就地放棄抵抗了。

面對這些驗證碼的時候，不知道差友們有沒有想過，這種明顯讓用户體驗不佳的東西，到底有啥存在的意義呢？

其實啊，驗證碼的用處可以用簡單的一句來解釋清楚：區分計算機和真正的人。

而這一切要從驗證碼的歷史講起。

驗證碼英文叫做 “ CAPTCHA ”，這七個大寫的字母是 “ Completely Automated Public Turing test to tell Computers and Humans Apart ” 這個超長詞組的縮寫，直譯就是**“ 全自動區分計算機和人類的圖靈測試 ”**。

而圖靈測試是人工智能圈一個著名的實驗，實驗者詢問一台機器和一個人類一些問題，如果實驗者無法分辨他倆的差別，那麼這台機器便通過的圖靈測試。

驗證碼就是這個圖靈測試的反向和變種，用來區分計算機和人類。

在 2000 年初，互聯網的浪潮剛剛在全世界掀起，當時最讓大夥苦惱的一件事就是垃圾郵件太多了。甚至有一羣傢伙還特意製作了程序，可以終日無休地大量註冊新郵箱賬號，然後用來發送垃圾推廣郵件。

公司封號刪除的速度遠遠趕不上他們註冊的速度，用户郵箱中的重要郵件也常常被一大波的垃圾郵件所淹沒。

互聯網公司和用户都深受其苦。

一位名叫 Luis 的天才程序員就想到了法子，他發現計算機程序很難認清手寫的文本，而人類可以輕鬆地看懂。可以在註冊賬號的時候設一道門檻，必須輸入 “ 歪曲 ” 的文本才能完成註冊，用來識別計算機和真人。

驗證碼從此孕育而生，無數的黃牛、垃圾郵件、還有爬蟲程序就這樣被驗證碼擋在了外面。

如今，國內外就有許多公司專門為網站提供驗證碼服務，例如為 12306 提供驗證碼的微觸科技、為鬥魚和 B 站提供服務的極驗科技，甚至身為互聯網巨頭的谷歌，也同時是世界最大的驗證碼服務提供商。

隨着計算機的識別技術越來強，驗證碼也變得越來越 " 扭曲 “，驗證碼的形式和花樣也越來越多。

到目前為止，輸驗證碼還是區別人和計算機最有效率的方法。

但也有網友做過計算，全世界的網民一天共要輸入的近 2 億次驗證碼，每次輸入按花費十秒計算，那麼人類每天花在驗證碼上的時間已經超過了 50 萬小時。。。

或許有差友會脱口而出：浪費時間就是浪費生命！驗證碼浪費了人類大量的生命！

球都嘛得，説起來你可能不信，實際上輸入驗證碼的時間並沒有全被浪費，反而每一次輸入驗證碼，你都可能是在為人類的文化事業，或者是為人工智能貢獻着一份力。

還是那個發明了驗證碼的天才 Luis，他發現許多公益組織在把舊書籍掃描成電子版，對計算機來説，那些斑駁的文字太難識別了。

書籍的內容大部分是文本、驗證碼也是文本，把掃描版的書籍文本對接到驗證碼上，讓用户來識別不就行了？於是乎一個叫做 reCAPTCHA 的新式驗證碼系統誕生了。

reCAPTCHA 會提供兩個單詞給用户來識別。這兩個單詞都是書籍掃描版的一部分。

計算機其實已經知道第一個單詞是啥了，之所以要展示出來，就是為了測試一下你是不是真人。

不過第二個單詞計算機暫時還沒能力認出來。面對這第二個單詞，一旦有 10 個人輸入了同樣的答案，那麼這答案就會被當作是正確答案。靠這種方法，reCAPTCHA 每年能成功數字化 230 多萬本舊書。

仔細看 reCAPTCHA 驗證碼的右下角，你還能看到正能量滿滿的話語：Stop spam.Read books.

別發垃圾郵件了，去讀些書吧！

除此之外，你輸的驗證碼，還可能成為了人工智能訓練的養料。

大夥們肯定遇到過這類街景驗證碼，讓我們選中小轎車、路牌或是自行車等等圖片。在你費眼又費腦地輸入它們的時候，你其實是在為谷歌的人工智能免費打工。

因為這些圖片大都來自於谷歌街景，其中的一部分圖片是 AI 已經識別出來的，用於來識別你是否是真人。

和之前的書籍電子化一樣的套路，其中還夾雜了幾張 AI 難以識別的街景，用來白嫖你的勞動力。而這些數據，最後會被用於培訓人工智能。

對於這種空手套白狼的行為，谷歌官方也不藏着掖着，就直接叫告訴大家：你們的免費勞動力，我拿走了！

在各位的 “ 辛勤餵養 ” 之下，運用了谷歌 AI 技術的無人駕駛汽車 Waymo，已經在自動駕駛領域處於遙遙領先的地位，被稱作是世界上最可能最先到 L5 級別（完全自動駕駛）的公司。。。

如今，收購了 reCAPCHA 的谷歌已經把大部分驗證碼都升級成了 reCAPCHA v3。用户只要點擊一下 “ 我不是機器人 ” 的按鈕，就能輕鬆通過驗證。

但即使是你鼠標的這麼輕輕一點，驗證碼還是能從你身上吸點油水。

因為在你點擊按鈕的同時，谷歌會監控你的用户行為。鼠標的運動軌跡甚至是你打開的網頁都會被收集，這些數據會被用來判斷你是否是真人，並且幫助驗證碼系統進化。

而且目前國外有超過 65 萬個網站用 reCAPCHA v3，每點擊一次驗證按鈕，就等於打卡告訴谷歌你來過這兒，谷歌就會根據你去過的網站來給你推送定製的廣告。。。

而點擊驗證碼的用户，只不過是在無償地為谷歌提供數據罷了。。。

隨着 OCR （光學字符識別）技術和 AI 的發展，驗證碼也在不斷被破解中，過去簡單扭曲一下的字母，可擋不住現在的程序了。

但無論驗證碼怎麼進化，只要你是真真切切的人，驗證碼這關都不可能真正擋住你。就像 reCAPCHA 一直所倡導的那樣：Tough on bots，Easy on humans ( 對機器人困難，對人類簡單）。

而你每一次輸入驗證碼，都可能是在為人類文明添磚加瓦，或是在為人工智能的發展貢獻着一份力。

這麼一想，是不是感覺自己的鍵鼠都在散發着無私的榮光呢？

圖片、資料來源：

36 氪,《 41 歲的天才數學教授，創造了 “ 驗證碼 ” 和 “ 多鄰國 ” ，身家 7 億美元》

維基百科, reCAPCHA

搜狐科技，《你以為自己在填驗證碼，其實你是在給 Google 義務勞動》