AI產業的IPhone時刻:很遺憾,我們再次被卡了脖子_風聞
酷玩实验室-酷玩实验室官方账号-03-28 08:46
如果半個月前我因為某些原因被拘留了十五天,出來的時候我一定會有一種穿越了的感覺,因為這世界變化太大,而變化來自AI:
上上週一,微軟發佈了新的office辦公工具,基於ChatGPT大語言模型的Copilot。以後不管是在Word,Excel,PPT還是郵件系統,都會多出一個對話框也就是一個人工智能助手,它可以幫你改文章,做ppt,查詢數據。比如當你在用Excel查公司數據的時候,你可以跟它直接説:“請把過去一年公司增長的原因找出來”它就會把關鍵增長部門的數據劃重點提示你。

如果你錯過了一個重要的會議,你可以根據會議記錄問他,“主要討論了啥,各方面都有什麼觀點啊?什麼問題沒有解決啊?”當然也可以用Word文檔直接生成PPT。相當於讓每個人都可以擁有一個清華畢業的秘書。

上上週三,OpenAI發佈了新版本的GPT-4,也就是新版本的AI大模型,與人類對話更加準確,一本正經胡説八道的概率大大降低,還能看懂圖片。

(問:這張圖片有何特殊之處?GPT-4答:有個男人在飛馳的車上熨衣服)
上上週四,圖片生成工具Midjourney V5發佈,基本上解決了之前AI畫不好手指的問題,整體產出的圖片不像之前版本那麼天馬行空,卻更接近真實場景,很多時候讓人難辨真假。

(夜晚燈光下的女孩)

(被紐約警察逮捕的懂王)
另外,百度的大語言模型文心一言也在這一天發佈公測,成為第一個發佈類ChatGPT大模型的互聯網大廠。

上週二,在英偉達的年度開發者活動GTC上,黃仁勳做了主旨演講,通篇沒有一處提到遊戲顯卡,而是在軟件部分發布了100多個基於英偉達通用GPU和CUDA架構的加速計算工具,包括流體力學仿真、數據庫處理、光刻機掩膜設計和AI等,更新了工業元宇宙Omniverse;在硬件部分發布了四款AI推理芯片,新的超級計算機,整體上把AI的運算效率提升了一個數量級;還發布了三個基於AI大模型的雲服務,分別面向文本處理、圖像處理和生物醫藥研究。

上週三,繼百度之後,谷歌也發佈了他們的AI大語言模型Bard,進入公測階段。不過公測的效果依託答辯,還不如百度的文心一言。
同一天,GitHUB發佈了接入GPT-4的AI編程工具CopilotX,只要跟它説你要的功能它就會幫你把代碼寫出來,還能幫你本身的代碼找錯改錯。

還是在同一天,Runway發佈了他們的AI視頻生成工具Gen-2,不同於上個版本需要輸入文字+圖像才能生成視頻,Gen-2只要輸入文本就能生成視頻。
比如生成一個沙漠地形。

或者一個人在衝浪。

上週五,OpenAI推出了ChatGPT的插件功能,可以把你的網站或者App跟ChatGPT連上,起到的作用類似於,比如説你是王興,你把美團跟ChatGPT連上,然後用户就可以給AI助理下指示:“週末要帶女朋友去大理玩”,讓後它就會根據美團上的商家用户評論數據,過幾秒鐘給你把行程酒店機票餐廳全給安排了,然後你跟它説“太貴了”,然後它就給你整體搜一圈優惠。這不僅開啓了ChatGPT應用的無限場景,更大的改變是有可能以後大家就不上美團,也不在應用商城裏下美團了,而是直接在ChatGPT裏用美團或者別的什麼生活服務App了,直接顛覆了互聯網流量入口。
01
AI的IPhone時刻
AI正在以天為週期進化,給人前所未有的壓迫感,對此比爾蓋茨和英偉達老闆黃仁勳的表態是最具代表性的。
比爾蓋茨表示:這就像我當年第一次見到圖形界面操作系統(MacOS)****。
黃仁勳在發佈會上三次強調:我們正在經歷又一個IPhone時刻**。**
比爾蓋茨靠着抄Mac的圖形界面操作系統抄得夠快以及設計出了快速擴張的商業模式,率領微軟登上巔峯成為世界首富。
黃仁勳因為錯過了IPhone帶來的移動互聯網革命,他公司股價從2007年高峯的接近十美元一度掉到接近一美元(現在是268美元),差點嗝兒屁。
我相信這兩人對於他們口中的那個時刻,一定是印象深刻的,做夢都會夢到的那種。
每一項改變世界的技術的發展,都會大致遵循一個曲線:
當它剛被提出的時候,只有少數學術精英會注意到它,試圖探索出完整的技術實現路線,這個階段的發展是平緩和持久的;
直到有一天,有人提出了完整的技術方法,人們會讚歎它的偉大,投資和關注蜂擁而至達到高峯,但往往勉強能實現的技術不能滿足業界和消費者的期待,大家轉瞬之間變得失望,投資人作鳥獸散,關注度跌入谷底;
這個過程會重複若干次,直到有一天,出現了一個劃時代的產品,它真正滿足了大眾消費者的需求,業界為之瘋狂,開發者魚貫而入,產業一飛沖天!

1984年喬布斯在Macintosh電腦上安裝了鼠標和圖形界面操作系統,以前電腦需要通過鍵盤輸入格式化的指令來操作,如果大家用過Dos系統的話應該會有印象,學習門檻很高,而Macintosh電腦直接看着圖像用鼠標點就行,完全符合人類直覺。從此家用電腦從少數極客程序員的生產工具,一躍成為每個人都能使用的學習娛樂辦公終端,電腦從此開始進入尋常百姓家。

2007年喬布斯發佈IPhone,重新發明了智能手機。多點觸控屏幕的出現使得我們操作手機App、打遊戲不再受制於小到根本按不準的實體按鍵,而後續AppStore規範化了手機端的應用格式,視網膜屏幕拉近了我們跟手機屏幕之間的距離,最終隨着4G移動網絡的普及,我們進入到了移動互聯網時代。

ChatGPT在今年1月,也就是推出僅兩個月後,月活躍用户就達到1億,成為歷史上增長最快的消費應用,排名第二的TikTok用了13個月。

而對於它的討論早已不限於科技創投圈,現在我研究大家玩AI有什麼新玩法,最好的平台,不是知乎B站,而是小紅書,集美們都在為AI瘋狂。

我想已經不必多説,ChatGPT就是AI的IPhone時刻。
02
有關效率和可能性的革命
我們需要為即將到來的AI革命做好準備,正如我們本應該在2007年為即將到來的移動互聯網革命做好準備。
我們現在稱之為AI的這個東西其實是很多AI技術路線當中的一種,叫做神經網絡,是上世紀五十年代以來一系列模型、算法、計算機發明累積的結果。它的是一種對人腦神經元連接的模擬,特點也非常像人腦,就是你給AI一個問題,它能給你一個結果,你可以通過訓練去讓這個結果變得更加令你滿意,但是沒法具體操作中間的過程,整個過程也沒有太多的邏輯。
舉一個之前説過的例子,這是一張末代皇后婉容的照片。

用AI模型上色之後,就成了這樣。

當然它還可以有很多別的配色。

那AI是怎麼完成黑白照片上色的呢?
如果讓我這個人類去給這張照片上色的話,我能想到兩種方法:
方法1:我先去調查婉容這件衣服的材質,甚至嘗試去找到這件衣服本體,再結合史料上拍這張照片的時間地點,當天的天氣光照,確定一種最有可能的顏色給它塗上去。這種方法叫做分析推理。
方法2:我隨便找個看着不突兀的顏色就給它塗上,然後所有的背景事物照此操作,最後出來照片像那麼回事兒就行。因為我看過很多女人穿着衣服的彩色照片,也看過很多清宮劇,那個味兒我還是很熟悉的。這種方法我們姑且稱之為套模板,或者説內味兒法。
AI並不擅長分析推理,但它非常擅長找出內味兒然後總結成模板到處套,特別是在最近這一輪大模型革命之後,AI變得非常、非常擅長總結模板到處套。
這既體現為它無與倫比的效率,也體現為它無人可及的能力。
先説效率。
就拿開頭提到的微軟給Office軟件做的Copilot來説,它很難承擔原創性的工作,也就是它無法替代你去形成目標、決心、策略,但它能比任何人都更高效的完成擴展、翻譯、總結、查找。
比如做週報把你上週做劃的水寫成精神飽滿的文字就是典型的擴展,用文本形成ppt可以看成是在不同內容形式之間進行翻譯,把兩小時的會議總結成500字會議紀要當然是一種總結,而在繁雜的Excel數據中找到關鍵增長指標就是查找,這些本來需要投入幾小時甚至幾天去完成的工作,現在AI能在幾秒鐘之內幫你完成。
更有意思的地方在於,這裏的擴展、翻譯、總結、查找都是廣義上的,比如把中文內容變成英文當然是翻譯,把同一封郵件根據不同發送對象改成或輕鬆或嚴肅的語氣是翻譯,把內容在文字,圖片,視頻,3D模型甚至蛋白質結構當中轉換是翻譯,當然把人類能理解的自然語言轉成計算機能理解的編程語言也是翻譯。
於是圍繞AI大模型就產生了大量的應用,所有剛才提到的場景都已經有相對成熟的產品,比如文字轉圖片的MidJourney,Discord,Adobe Firefly,文字轉ppt的Tome,Copilot,文字轉視頻的Runway,文字轉網站代碼的CopilotX等等等等;現在美國的互聯網新產品發佈網站Product Hunt上面,一半以上的新發應用是基於AI幫你解決各種各樣的小問題的。
比如有個叫BookAi.chat的幫你查書的網站,你只要輸入一本書的名字和作者,它就會幫你從這本書當中找答案回答你的問題。一方面它能幫你快速提取一本書的精華內容,幫你快速看書;另一方面它也能輔助你看書,當你在看一個大部頭的小説比如哈利波特,你看到後面忘了斯內普教授是誰了,你就可以問他。
再比如在管理軟件領域的大數據分析。
現在的大型連鎖商店都會蒐集大量經營數據以供分析,但是當運營人員真的提出要看某些數據的時候,首先數據涉及到商業機密不能讓你隨便看,然後你的電腦也跑不了那麼大的數據庫。這時候就需要專業的工程師去幫你調取特定的數據,他們會根據先來後到輕重緩急給調取數據的要求排個序,你會進入到排隊隊列,真的拿到數據的時間可能是兩個月以後。ChatGPT把這個時間縮短到了幾秒鐘。
最近跟一些創業者和公務員朋友深入聊AI革命,發現實際上我們日常的工作當中,只有非常非常少的一部分是嚴格意義上的原創,而是有大量的信息搜索總結翻譯擴展,大量的溝通,上傳下達。當AI充分介入之後,這些流程將會不復存在,公司老闆和國家領導人,將可以直接獲取最基層的信息,而絕大多數產品的開發週期,都會縮減到一天以內,上午形成想法,晚上網站上線,甚至配合日益成熟的3D打印技術,上午形成想法,晚上零件入庫。
這就是AI能給我們帶來的效率。而更激動人心的,是AI創造的新的可能性。
有一種醫療診斷技術叫做fMRI(功能性磁共振成像),可以觀測記錄到大腦血流的微小變化。我們認為大腦在工作的時候,比如説看一張圖片,必然會導致各部分的神經元產生不同的對能量氧氣的需求,進而導致血流量的微小變化,而這個數據可以通過fMRI記錄下來。
那有沒有可能這種血流的微小變化數據,跟我們現在看到的圖像存在對應的關係呢?當然是有可能的。但是這裏這個對應的模板,這個味兒太複雜了,完全超出了人腦的理解能力。
而一個日本大阪大學的團隊,用一個叫做Stable Diffusion的AI模型,利用fMRI數據,畫出了這樣的圖像。

患者看到的原圖是這樣的。

再看兩張,這是AI畫出來的:

這是患者看到的:

這是AI畫的:

這是患者看到的:

這為我們展現了一種實現非侵入式腦機接口的可能性,未來在義肢、輪椅等領域有巨大應用前景,如果説得科幻一點,這就是在字面意義上實現了讀心術。
短短11頁的論文,讀心術,是不是很大膽?
更大膽的是,像這樣我們知道兩件事情,兩組數據之間有關聯,而用人腦不知道如何對應上的情況,在人類社會比比皆是。
馬丁路德金曾説,我夢想有一天,我的四個孩子將在一個不是以他們的膚色,而是以他們的品格優劣來評價他們的國度裏生活。
什麼叫做一個人的品格?這曾經是一個抽象的概念,體現為一個人的所有行為舉止的集合,而人的行為舉止這個數據,其實是可以記錄的。
比如數字生命實際上已經可以實現了。對於一個心智成熟的成年人來説,TA在網絡上未來的行為,可以認為是過去行為的一種延續。於是只需要對你在網絡上所有足跡,看了什麼、發了什麼做一個數據記錄,然後讓AI大模型去學習這組數據,就有可能生成一個數字化的“你”。這個“你”可以替你去發評論發彈幕發文章做視頻私信表白對線,甚至可以替你花錢,替你做內容賺錢。前兩天聊到這件事,有個朋友甚至説他死後更想把遺產留給這個數字化的自己,因為這個數字人比任何人都更能繼承他的遺志。
更進一步説,如果能對大腦的神經信號進行細節的收錄,那流浪地球2裏面的那種完全能代表你線上線下所有所思所想的數字生命,也可以實現了。
這就是一個人的品格,它被AI破解了。
有人在網上發了一組新聞圖片,説的是著名的01年美加西海岸9.1級大地震大海嘯事件,以及它們造成的破壞和後續的救援。

(地震來了,人們驚慌失措)

(地震造成建築損毀,橋樑垮塌)

(震後羣眾尋找親人,消防隊投入救援)

(小布什總統慰問災民)
整個街景、色調、人物着裝,都是2001年內味兒,唯一的問題是,這組圖片是用Midjourney生成的,根本就沒有這場大地震。
所謂真實感,來自於我們看到新聞內容的點點滴滴,而這個點點滴滴跟真實感之間的關聯,本來應該是抽象的,而現在已經被AI破解,以後再也沒有眼見為實了。
這些案例看起來可能會感覺一些瘋狂可怕,我也有這種感受。自200萬年前以來,人類一直是已知世界智能最高的存在,我們早已對此習以為常。而如今,一種新的智能正在破解我們所有抽象的概念。
馬克思認為世間萬物是普遍聯繫的,而AI大模型説,這種聯繫是可以被破解的。
03
革命再臨,唯有向前
喬布斯發佈初代IPhone的2007年,正是美式全球化的巔峯,中國在其中如魚得水,隨後深度參與了移動互聯網革命,產生了諸多世界級的手機品牌、互聯網平台,以及世界上最強大齊全的3C電子供應鏈。
而今時不同往日,全球化進入退潮期,美國對華科技封鎖正持續收緊。
從去年10月7日開始,美國根據新的芯片法案,開始限制單精度浮點算力19.5T FLOPS以上,或雙精度浮點算力 9.7T FLOPS以上,或存取速度600GB/S以上的GPU對華出口以及相關人員設備對華服務,也就是限制英偉達A100或者以上級別的通用GPU對華出口,這一舉措顯然意在限制中國AI大模型的訓練算力。
去年11月30日,ChatGPT發佈,中國大陸是四個IP地址禁止訪問ChatGPT的地區之一,其它三個是分別是俄羅斯、伊朗和香港。
按照打壓中國在芯片、操作系統等尖端領域追趕美國的邏輯,美國的新一代芯片和操作系統應該儘可能擴張佔領中國市場,正如當年高通、英特爾和微軟做的那樣,所以這一波的封禁是非同尋常的。
顯然美國希望整個把中國排除在這一輪AI革命之外,不只是芯片操作系統,是整個排除在外。Very exciting。
AI芯片,超級計算機,雲服務,AI開發框架、編程語言,大模型以及基於大模型的終端應用,組成了萬億級別的AI產業機會。
但是台積電壟斷了AI芯片代工,英偉達壟斷了高端通用GPU設計和AI開發框架(CUDA),導致整個產業只有後端的大模型和終端應用對中國企業部分開放,並且隨時可能被掐斷。
與此同時,隨着AI革命發生,工程師紅利實際上已經沒有了。
什麼叫做工程師紅利?一個新的發明出來,中美的團隊幾乎同時看到,同時開始工程調優,美國人磨磨唧唧一年拿不出成熟的產品,中國人996兩個月搞定了,於是就佔據了先機,這個循環再走幾輪,美國團隊徹底沒影了,這就是工程師紅利。
我本身對於這種建立優勢的方式沒有意見,這個世界的競爭是殘酷的,任何能建立優勢的辦法都得用上。
但現在AI 10秒鐘就搞定,你再在那兒996,就會顯得很搞笑。
一場有關極致效率和無限可能性的革命正在發生,世界的經濟發展正在向創新驅動快速移動。
要是還有一些什麼東西在阻擋着我們轉型成創新型國家,是時候做出改變了。