説起來你可能不信,大夥可能都被驗證碼白嫖過了_風聞
差评-差评官方账号-2020-08-02 07:59
本文原創於微信公眾號:差評 作者:差評君
只要上網衝過浪的人,基本上就沒有不知道驗證碼這玩意的。這些年來,驗證碼的形式也被玩得越來越花。有不少的網友吐槽,沒有一些知識儲備,連驗證碼都要看不懂了。
差評君的驗證碼成績也並不理想,特別是在遇到滑動式驗證碼這種細緻活兒時,就經常因為手抖而前功盡棄。

還有這種高數答題式驗證碼,沒有點數學知識積累的用户,基本上就只能行法式軍禮就地放棄抵抗了。
面對這些驗證碼的時候,不知道差友們有沒有想過,這種明顯讓用户體驗不佳的東西,到底有啥存在的意義呢?
其實啊,驗證碼的用處可以用簡單的一句來解釋清楚:區分計算機和真正的人。
而這一切要從驗證碼的歷史講起。
驗證碼英文叫做 “ CAPTCHA ”,這七個大寫的字母是 “ Completely Automated Public Turing test to tell Computers and Humans Apart ” 這個超長詞組的縮寫,直譯就是**“ 全自動區分計算機和人類的圖靈測試 ”**。
而圖靈測試是人工智能圈一個著名的實驗,實驗者詢問一台機器和一個人類一些問題,如果實驗者無法分辨他倆的差別,那麼這台機器便通過的圖靈測試。
驗證碼就是這個圖靈測試的反向和變種,用來區分計算機和人類。
在 2000 年初,互聯網的浪潮剛剛在全世界掀起,當時最讓大夥苦惱的一件事就是垃圾郵件太多了。甚至有一羣傢伙還特意製作了程序,可以終日無休地大量註冊新郵箱賬號,然後用來發送垃圾推廣郵件。
公司封號刪除的速度遠遠趕不上他們註冊的速度,用户郵箱中的重要郵件也常常被一大波的垃圾郵件所淹沒。
互聯網公司和用户都深受其苦。
一位名叫 Luis 的天才程序員就想到了法子,他發現計算機程序很難認清手寫的文本,而人類可以輕鬆地看懂。可以在註冊賬號的時候設一道門檻,必須輸入 “ 歪曲 ” 的文本才能完成註冊,用來識別計算機和真人。
驗證碼從此孕育而生,無數的黃牛、垃圾郵件、還有爬蟲程序就這樣被驗證碼擋在了外面。
如今,國內外就有許多公司專門為網站提供驗證碼服務,例如為 12306 提供驗證碼的微觸科技、為鬥魚和 B 站提供服務的極驗科技,甚至身為互聯網巨頭的谷歌,也同時是世界最大的驗證碼服務提供商。
隨着計算機的識別技術越來強,驗證碼也變得越來越 " 扭曲 “,驗證碼的形式和花樣也越來越多。
到目前為止,輸驗證碼還是區別人和計算機最有效率的方法。
但也有網友做過計算,全世界的網民一天共要輸入的近 2 億次驗證碼,每次輸入按花費十秒計算,那麼人類每天花在驗證碼上的時間已經超過了 50 萬小時。。。
或許有差友會脱口而出:浪費時間就是浪費生命!驗證碼浪費了人類大量的生命!
球都嘛得,説起來你可能不信,實際上輸入驗證碼的時間並沒有全被浪費,反而每一次輸入驗證碼,你都可能是在為人類的文化事業,或者是為人工智能貢獻着一份力。
還是那個發明了驗證碼的天才 Luis,他發現許多公益組織在把舊書籍掃描成電子版,對計算機來説,那些斑駁的文字太難識別了。
書籍的內容大部分是文本、驗證碼也是文本,把掃描版的書籍文本對接到驗證碼上,讓用户來識別不就行了?於是乎一個叫做 reCAPTCHA 的新式驗證碼系統誕生了。
reCAPTCHA 會提供兩個單詞給用户來識別。這兩個單詞都是書籍掃描版的一部分。
計算機其實已經知道第一個單詞是啥了,之所以要展示出來,就是為了測試一下你是不是真人。
不過第二個單詞計算機暫時還沒能力認出來。面對這第二個單詞,一旦有 10 個人輸入了同樣的答案,那麼這答案就會被當作是正確答案。靠這種方法,reCAPTCHA 每年能成功數字化 230 多萬本舊書。
仔細看 reCAPTCHA 驗證碼的右下角,你還能看到正能量滿滿的話語:Stop spam.Read books.
別發垃圾郵件了,去讀些書吧!
除此之外,你輸的驗證碼,還可能成為了人工智能訓練的養料。
大夥們肯定遇到過這類街景驗證碼,讓我們選中小轎車、路牌或是自行車等等圖片。在你費眼又費腦地輸入它們的時候,你其實是在為谷歌的人工智能免費打工。
因為這些圖片大都來自於谷歌街景,其中的一部分圖片是 AI 已經識別出來的,用於來識別你是否是真人。
和之前的書籍電子化一樣的套路,其中還夾雜了幾張 AI 難以識別的街景,用來白嫖你的勞動力。而這些數據,最後會被用於培訓人工智能。
對於這種空手套白狼的行為,谷歌官方也不藏着掖着,就直接叫告訴大家:你們的免費勞動力,我拿走了!
在各位的 “ 辛勤餵養 ” 之下,運用了谷歌 AI 技術的無人駕駛汽車 Waymo,已經在自動駕駛領域處於遙遙領先的地位,被稱作是世界上最可能最先到 L5 級別( 完全自動駕駛 )的公司。。。
如今,收購了 reCAPCHA 的谷歌已經把大部分驗證碼都升級成了 reCAPCHA v3。用户只要點擊一下 “ 我不是機器人 ” 的按鈕,就能輕鬆通過驗證。
但即使是你鼠標的這麼輕輕一點,驗證碼還是能從你身上吸點油水。

因為在你點擊按鈕的同時,谷歌會監控你的用户行為。鼠標的運動軌跡甚至是你打開的網頁都會被收集,這些數據會被用來判斷你是否是真人,並且幫助驗證碼系統進化。
而且目前國外有超過 65 萬個網站用 reCAPCHA v3,每點擊一次驗證按鈕,就等於打卡告訴谷歌你來過這兒,谷歌就會根據你去過的網站來給你推送定製的廣告。。。
而點擊驗證碼的用户,只不過是在無償地為谷歌提供數據罷了。。。
隨着 OCR ( 光學字符識別 )技術和 AI 的發展,驗證碼也在不斷被破解中,過去簡單扭曲一下的字母,可擋不住現在的程序了。
但無論驗證碼怎麼進化,只要你是真真切切的人,驗證碼這關都不可能真正擋住你。就像 reCAPCHA 一直所倡導的那樣:Tough on bots,Easy on humans ( 對機器人困難,對人類簡單 )。
而你每一次輸入驗證碼,都可能是在為人類文明添磚加瓦,或是在為人工智能的發展貢獻着一份力。
這麼一想,是不是感覺自己的鍵鼠都在散發着無私的榮光呢?
圖片、資料來源:
36 氪,《 41 歲的天才數學教授,創造了 “ 驗證碼 ” 和 “ 多鄰國 ” ,身家 7 億美元 》
維基百科, reCAPCHA
搜狐科技,《 你以為自己在填驗證碼,其實你是在給 Google 義務勞動 》