2024年AI商業落地的十個方向_風聞

秦朔朋友圈-秦朔朋友圈官方账号-2小时前

2024-01-09

轟轟烈烈的2023年AIGC元年結束了，心情有點複雜。

在國內，和年初ChatGPT炸雷帶來的全民興奮相比，AI並沒有給普通人的生活帶來多少改變。

AI——這個當之無愧的下一代信息技術革命，沒像上一波移動互聯網浪潮中的微信和滴滴打車，在一年的時間裏實現“一夜春風來、萬樹梨花開”式的商業滲透。認真使用AI工具的人不多，現象級的AI產品完全沒有出現。

在海外，ChatGPT以迅雷不及掩耳的速度斬獲1.8億用户，AI繪圖軟件MidJourney獲得超1500萬用户和數億美元營收；微軟的GitHub編程助手Copilot在9月份付費用户已超百萬（含3萬7千個組織訂閲），多個小型APP號稱獲得數百萬美元的訂閲收入。

在硅谷和華爾街，逢人必談AI。美股在AI芯片霸主英偉達和AI應用先鋒微軟的帶領下，日日創出新高。

不誇張地説，若無AI，美國可能已陷入經濟衰退；有了AI，美國走在了新一輪泡沫的路上。

比爾蓋茨認為：在像美國這樣的高收入國家，距離普通大眾使用人工智能達到顯著水平還有18到24個月的時間。在非洲，他預計在三年左右的時間裏會看到類似的使用水平。據此預測，2024年美國會達到人工智能的“普惠”狀態。

中國和美國的人工智能差距正在拉大。由於對英偉達GPU的禁令，全世界最緊俏的商品變成了英偉達的GPU或平替，甚至有人不恰當地把GPU比作超過毒品的新一代最暴利走私品。

和爭奪土地、石油、黃金的戰爭一樣，人工智能算力、算法變成了大國軍備的新戰場，也成為企業家和創業者的兵家必爭之地。

時不我待，何以勝出？下文我主要採用AI在醫療、金融等嚴肅領域的實際需求案例，探討AI在2024年從技術到產品商業落地的10個方向：

1. 更強的多模態交互

2. 可解釋性更強的人工智能

3. 更強的搜索增強生成

4. 構造自動代理生態

5. 更強、更經濟節能的算力

6. 更快的AI平民化進程

7. AI與Web3結合的破局

8. 打磨用户需要的“小”產品

9. AI能力帶入數據，而不是相反

10. 獲取用户對AI的信任

更強的多模態交互

多模態交互類似於人類的多維感官能力。多模態人工智能可以交叉處理和分析文本、圖像、語音多種數據類型。這種融合不同模式的方法使機器能夠全面、立體地理解世界。

在去年聖誕節，很多賀卡由AI生成。這是從文字生成的圖片和視頻。從文字生成音樂和歌曲還不成熟。GPT4.0的語音對話相當給力，可以直接用中文和它對話。美中不足的是，總覺得GPT的中文發音是我國台灣人夾雜海外華人的腔調，有點像王力宏。

以醫療領域的需求看，病人拿到血常或腫瘤指標檢查報告，想知道異常指標的意義。對自己負責的病人會上網搜索每個指標的含義。入冬以來兒童夾雜肺炎和流感，很多焦慮的家長會搜索檢查結果的意義，往往費時費力，找不到準確的解讀。

多模態技術的發展，可以讓用户拍照上傳檢查報告，AI識別照片中的指標、搜索知識庫、給出每個指標的含義，然後用語音告訴可能的診斷。這種體驗太棒了。

在金融領域，如果上傳一張K線圖，AI就能識別出其形態，則可以極大地提升技術分析投資者的效率。在芯片設計或建築設計領域，如果能讓AI讀懂設計圖，再設計出新的設計圖，那就更厲害。

在非嚴肅領域，多模態會大大提高數字形象、短視頻製作的效率，豐富這些應用的使用場景。

可解釋性更強的人工智能

可解釋的人工智能的目標在於提高AI決策過程的透明度和可理解性，從而能夠更好地理解AI如何作出決策。

當前的AI決策過程往往被視為一個“黑盒”，用户無法瞭解模型得出結論的內在邏輯。大語言模型最強大且是最神秘的“湧現”能力，亦無法被解釋。無法被解釋的決策過程，不可能在嚴肅商業領域獲得信任。

AI看完檢查報告，可以給出用藥建議。如果不知道這個用藥建議基於何種知識，也不知道AI做出推理和判斷的過程，相信沒有人敢用AI開出的藥方。生命不能作AI概率遊戲的試驗品。

現舉例説明。我問ChatGPT:

“如果換算成特斯拉的行駛里程，7200兆瓦時可以行駛多少公里？”

AI會告訴我它的邏輯——

為了估算7200兆瓦時（MWh）的電能可以讓特斯拉汽車行駛多少公里，我們需要知道特斯拉汽車的能源效率。以特斯拉Model 3為例，其能源效率大約為15千瓦時/100公里（即0.15千瓦時/公里）。

我們可以通過以下公式計算行駛里程：

總行駛里程=總電能（千瓦時）/每公里耗電量（千瓦時/公里）

現在我們可以計算7200兆瓦時（即7200000千瓦時）可以讓特斯拉汽車行駛多少公里。我將進行計算（此處，AI寫Python代碼進行計算）。

使用7200兆瓦時的電能，一個特斯拉Model 3理論上可以行駛約4800萬公里。

以上，AI展示了一個完整的、可解釋的AI推導。用户可以對每一步檢查、糾錯。

AI在嚴密的數學推理已經取得某些突破。近期，數學大神陶哲軒成功地用AI工具完成了形式化多項式Freiman-Ruzsa猜想證明過程的工作。陶哲軒大聲呼籲，數學家一定要會用AI。

可解釋的人工智能的實現需要開發新的算法和工具，通過可視化技術、自然語言解釋或簡化決策邏輯的表示，以提供關於AI決策過程的深入洞察。

綜上，可解釋的人工智能在醫療、科學研究等嚴肅領域具有巨大的商業應用價值。在這些領域，決策的透明度和可信度至關重要，AI的大規模嚴肅應用必須在較高的置信度上給客户以流程控制和質量控制的選項和權利。

更強的搜索增強生成

搜索增強生成（Retrieval-Augmented Generation，簡稱RAG）是一種結合了信息檢索和文本生成的AI技術。它旨在通過從“外部”數據源檢索信息來增強和改善生成模型的輸出質量。

RAG使得大型語言模型能夠訪問外部信息，幫助它們產生更準確、更具上下文意識的回應，其目標在於提高語言模型生成內容的準確性和相關性。

在RAG系統中，當模型接收到一個查詢時，首先執行一個檢索步驟，查找與查詢相關的信息。然後，這些相關信息被融入生成過程，實現生成內容準確性和相關性的顯著改善。

以病人的需求為例，我的朋友曾親自嘗試ChatGPT 4.0搜索增強的能力。病人在服藥後發生間歇性尿失禁，但尿失禁到底是不是服藥的不良反應呢？在藥品説明書上找不到，醫生也不確定。

朋友最初給AI的問題是“卡培他濱（Capecitabine）的副作用是否包含尿失禁?”

AI的回答是：“尿失禁不是通常與卡培他濱直接關聯的副作用。卡培他濱的副作用通常包括胃腸道症狀，如腹瀉、噁心、嘔吐和口腔潰瘍等。尿失禁可能是由其他因素引起的，如泌尿系統的問題、藥物的其他副作用、或是與患者的整體健康狀況相關。”

如果把提問改成：“搜索英文專業醫學資料，卡培他濱的副作用是否包含尿失禁?”，AI開始自動用Bing搜索互聯網，然後它真的搜到了多個醫學文獻。

AI説：“根據我找到的英文專業醫學資料，尿失禁被列為卡培他濱的罕見副作用之一，發生率在0.01%到0.1%之間。這表明尿失禁確實可能是卡培他濱使用的潛在副作用，儘管它並不常見。”

AI可以給出它得出這個結論的多個可靠信息來源。AI如何搜索到這些信息、如何加快搜索的速度、如何綜合多個搜索結果做出推理和結論，是更強的增強搜索要做的事情。

RAG在企業級商業應用中具有顯著優勢。因為在面向客户的場景中，生成內容的準確性至關重要。RAG能夠減少生成型AI中的“幻覺”問題。“幻覺”指的是生成聽起來合理但實際上是錯誤的回答。在信息不對稱領域，用户不能判斷幻覺內容的對錯。這導致AI的應用受限。

此處説一個題外話，為什麼上面的例子需要指明搜索“英文”專業醫學資料？因為在某些不指明英文的情況下，Bing搜索引擎用中文搜索，在中文互聯網上找不到匹配的關聯信息。如果用最常用的某中文搜索引擎搜索，搜索到的結果大部分是廣告和商業網站上意義不相關的信息。

中文搜索引擎和中文互聯網的質量堪憂是AI發展的重大問題之一。因此，和大模型相比，想辦法打造更強的搜索增強生成技術，也許是在中文互聯網開發產品致勝的關鍵。

構造自動代理生態

上面搜索增強生成的討論，已經包含了自動代理的部分功能。

當AI經過自我學習和模型升級，當它瞭解到我總在搜索專業文獻後，當我再次詢問藥物副作用同樣模式的問題時，AI會自己啓動搜索專業互聯網的動作，而不需要我再做指示。就像我的秘書瞭解我的習慣、不需要我吩咐就把事情做了一樣。這是自動代理的用例之一。

自動代理是一種能夠自動獨立執行任務和做出決策的AI系統。這些代理展現了一定程度的自主性和主動性，能夠理解其所處的環境、設定目標，並採取行動實現目標，不再需要人類額外指導。

有一個開源項目叫AutoGPT，它自動分解任務的動作，然後自動分步執行，就像自動執行上面的搜索任務一樣。

自動代理在多個領域具有廣泛的應用前景。

2024年的訂外賣服務也許會變成：你只要和AI説中午訂三份我常吃的外賣和客户一起吃，不要辣。AI會自動分析你常吃的外賣、剔除辣的；它知道你是和客户吃，要吃好一點、貴一些；它根據送達的時間和午餐的時間選擇商家，然後自動買一份準時達保險。這些步驟在幾秒內自動完成。

不止訂餐服務，個人日常助理會是自動代理的一個重要應用場景。如果蘋果在2024年入局AI，Siri會變成一個更高級的自動代理。現在，你只可以指示Siri打開一個app，Siri還有點愚鈍。

自動代理和硬件結合，會有新的產品形態。使用AI加持的蘋果公司會是自動代理領域最有實力的競賽選手。

Humane公司開發的AI Pin是由Sam Altman支持的創新型可穿戴人工智能設備。AI Pin可以夾在衣服上，像校徽一樣。它能夠響應觸摸、語音指令和手勢，主要用於搜索和翻譯信息、導航等功能，通過語音和AI聊天機器人來交流信息。這款產品預計將在2024年3月開始向消費者發貨。

這意味着：未來的每個人都可以有一個隨身攜帶的小秘書，它記錄你的會議、見聞、聊天、思想，隨叫隨到，直到複製出你的數字生命，就像電影《流浪地球》裏的數字生命一樣。

顯然，自動代理需要完整的閉環生態構建和安全管控，它需要打通交互、採購、物流、支付全環節。我相信在2024年，此閉環生態將露出雛形，重量級選手會入場。

量子位，贊10萬+

更強、更經濟節能的算力

當前AI發展的一個關鍵限制因素是對大量計算資源的需求。這不僅增加了成本，而且導致了巨大的能源消耗。

AI聊天工具導致大型科技公司的水資源使用量劇增。計算產生熱量，進而需要大量水資源冷卻設備。

有數據表明，由於AI產品（如ChatGPT）日益受歡迎，微軟的全球水資源使用量增加了超過三分之一，達到了近17億加侖。谷歌的水資源使用量也比前一年增加了大約20%，約為56億加侖。研究員估計，使用GPT回答5到50個問題，大約消耗500毫升的水。

電力方面，根據估算，訓練GPT4.0耗時150天，耗費電力720萬度電，這些電夠特斯拉行駛4800萬公里。（這個換算是我在上文“可解釋的AI”部分的例子。做任何事情，我都想用AI試試看，不試不知道，一試嚇一跳。）

2024年需要更高效的AI算法以在減少計算資源需求的同時提高模型的性能。硬件方面，業內也在尋找新的材料和設計，如量子計算，以期實現更高效的數據處理、降低能耗。

在芯片禁令下，突破原有技術路徑，尋找升維競爭的突破，可能是中國企業的機會。這需要強大的風險投資資本支持。

對GPU的需求剛剛開始。當全球有20%的人，每天使用AI的時候，GPU的需求將增長百倍。美股科技股的天花板還很高。能在中國實現GPU“平替”的企業可以賺大錢。

更快的AI平民化進程

這又被稱為開發的民主化。它的含義是，AI的易用性使得人與計算機的深度互動簡單到像聊天一樣，幾乎任何人都能夠成為開發者。

AI開發的平民化意義重大。它意味着更多的人可以參與計算機產品的開發，不再侷限於專業技術人員或擁有高級編程技能的人。

我本是一個做投資的，只有20年前大學C語言編程基礎。因小孩喜歡畫畫，被AI繪畫吸引誤入AI的大坑。現在，我正在用GitHub AI編程助手和ChatGPT，用業餘時間開發一個功能複雜的AI應用軟件，我絲毫不覺得困難。在我和AI的共同努力下，AI正確寫出了我需要的所有代碼。

AI打破了計算機科學的技術壁壘，其實質是硅基生命向碳基生命敞開心扉，人類用自然語言就可以實現深度計算機技術的實現。

當大量不同背景的人都能參與到這場信息革命的浪潮中，此種多元化的參與帶來了更廣泛的視角和創新的可能性，必然極大加快人類技術爆炸的速度。

其意義重大程度，堪比近1000年來，人類完成的識字掃文盲運動。從第一封電子郵件發出，到人類普遍掌握互聯網技能，用了數十年。而用多模態技術的交互方式，AI可以用3年時間完成高難度計算機技能向人類白丁的普及，速度加快十倍、百倍。

在平民化浪潮下，低代碼、無代碼平台、開源平台的發展至關重要。這些平台通過提供簡化的編程接口，使非專業人士也能輕鬆構建和部署AI模型。

其次，用户友好的工具和界面的開發同樣重要，它們能夠降低AI開發的複雜性，使其更易於理解和操作。自動化和智能化的開發工具將極大地減輕人工編程的負擔，提高開發效率。

預計2024年的AI編程工具將更加強大，平民化的進程會進入加速發展期。在AI的幫助下，一個沒有編程基礎的普通人可以編寫出任何他想要的應用，如同文字掃盲運動讓普通人不再需要找人代寫信、自媒體技術發展讓每個人不再需要找期刊投稿就能發表自己的觀點。

當你有一個需求的時候，你自己就可以寫出這樣一個軟件，不需要再去找商業軟件——你完全個性化需求的軟件。

回到醫療的例子，一個腫瘤病人，有過去30個月每週的檢查結果數據，他想知道他的腫瘤指標變化的趨勢。這些結果存儲在醫院的系統裏，醫院的信息系統不對病人提供歷史數據摘錄和比較功能。病人或家屬需要手工摘錄出每個異常指標，記錄下來，劃出曲線。有了AI，病人可以讓AI寫一個APP，每週把紙質的檢驗報告拍照上傳，然後AI就自動識別結果，並更新畫出變化趨勢圖。

在目前的軟件範式中，用户需要尋找能滿足自己需求的軟件，軟件開發者需要在很多人的差異化需求中尋找公約數，小眾用户的需求不能被滿足。AI平民化將從根本上改變人使用計算機的方式和軟件開發行業的商業圖景。

在AI平民化的浪潮中，中國有可能會尤為被動。在物慾橫流的衝擊下，中國沒有像樣的程序員社區，中國的教育體制培養出的是在AI時代被拋棄的程序員和知識搬運工，有科學專研精神的人不多，全民創造力無法被激發。AI平民化水平低的國家將在未來的生產效率和創造性競爭中，落後於AI平民化水平高的國家。

AI與Web3結合的破局

OpenAI創始人Altman支持的一個Web3項目是WorldCoin。WorldCoin運行在以太坊區塊鏈上。它要做的是建立一個全球最大、公平的數字身份驗證體系。為了區別誰是活人、誰是機器人，WorldCoin通過掃描人眼的虹膜來實現身份認證。到今天，已經有數百萬人主動接受了WorldCoin的眼球掃描。如果不是區塊鏈和數字世界的“原住民”，普通人很難理解這個項目的意義何在。

以區塊鏈技術為基礎的Web3在2022、2023年陷入低谷，Crypto市場處在慢慢熊市的尾端。技術信徒們的創業熱情從Web3完全轉移到了AI。

區塊鏈作為數字世界的“生產關係”基礎設施，和AI作為數字世界的“生產力”激發工具，有天生結合點。如果相信硅基生命的未來，硅基生命的載體應該存在於區塊鏈上。

否極泰來，自2023年11月開始，區塊鏈資產獲得了巨大漲幅，熱情被重新點燃。2024年，伴隨區塊鏈市場的復甦，AI和Web3在去中心化算力、AI經濟價值的實現、智能合約自動化與優化、去中心化數據市場、個人隱私數據的使用、AI創作數字藝術品、數字孿生等方面，會找到突破點。

值得警醒的是，這種突破將快速產生暴富的機遇和歸零的騙局。

打磨用户需要的“小”產品

AI時代的大平台、大公司將壟斷基礎設施，大語言模型的終局只會有2到3家企業和開源模型。AI創業者需要認清這個殘酷現實，沒有顛覆性的創新和極強的資本能力、執行能力，不要走向“一將功成萬骨枯”路上的“白骨”之一。

基於此邏輯，大型科技公司將在平台戰鬥中鞏固先機。從硬件到軟件，在開發“+AI”產品的戰役中，大公司的實力明顯。基於此，AI將極大推動全球的資本開支、經濟強勢和科技股的牛市。

對應用型開發創業者，必須聚焦打磨用户需要的、完全AI原生的“小”產品。Web 2.0時代燒錢獲得用户規模經濟的打法不復存在。用户在APP上任何使用AI的動作，都需要支付費用，沒有人會用免費模式燒這麼多錢。

只有打磨出真正客户需要的產品，幫助客户提升效率的產品，才是王道。開發者需要從第一分鐘開始，就有用户付費意願認可。這種產品不怕小眾。但是，由於AI開發平民化的快速發展，創業者開發出成功產品的難度越來越大。

而為了打磨產品，創業者最重要的能力是把需求產品化的能力，要跟上大平台快速迭代的AI技術發展，然後快速而經濟地應用到產品需求中。

AI能力帶入數據，而不是相反

英偉達金融行業高管認為，隨着人工智能的進步呈指數級增長，金融服務公司將把計算能力帶入數據，而不是相反。

並非只在金融行業。事實上，沉澱在企業和個人的優質數據已經足夠龐大，問題是如何用AI能力全新地發揮這些數據的生產力。學術期刊數據庫《知網》也推出了人工智能助手。開發者不需要守着金礦向外尋覓。

據麥肯錫公司稱，像OpenAI的ChatGPT這樣的深度學習算法，經過企業數據的進一步訓練，每年可以在63個業務用例中增加相當於2.6萬億至4.4萬億美元的收入。巨大的金礦等待被挖掘。

開發者應聚焦用AI加持現存的有價值數據，滿足用户的效率要求、讓大數據在AI時代的場景中開始賺錢。

獲取用户對AI的信任

讓用户把更多的工作交給AI完成，需要AI獲得用户的信任。

經過2023年的新鮮感，見慣了新鮮玩意兒，用户不想再把AI當玩具，而是想用它實現靠譜的真實價值。即使是情感陪伴機器人，也需要有血有肉有情感的真實體驗。

能率先可控、準確、高質量地按照用户指示完成任務的AI產品將在2024年獲得大發展。

與此同時，構建信任需要更多早期用户擁抱AI的意願。一件新型事物的普及，如同一個石子投入池塘產生的漣漪。

AI是個新物種，產品開發人員和用户都需要學習如何和它相處。此種適應的過程需要工作方式、思維模式的根本轉變。一件事情，如果不用AI試一下，則不知道原來還可以這樣做。

比如，我寫本文的傳統方式是：閲讀已有的AI技術和商業方向文章，加入個人思考，然後在文章末尾加上無足輕重的參考文獻。而用AI寫文章的方式可把順序完全顛倒過來：先從參考文獻開始，讓AI閲讀並寫出參考文獻的要點，我再取其精華，加入個人的思考。

這會不會涉及版權和“洗稿”呢？紐約時報在12月底，起訴OpenAI大量採用紐約時報的內容。紐約時報的內容被用於紐約時報的競爭對手生產新的內容。紐約時報認為自己是大冤種。

我認為，不管人還是AI，判斷是否有價值內容的金標準是“獨立而有價值的思想”。AI和人類的互信模式會和以往的互信模式不同。

工業革命中，機器的意義是幫助人擺脱了重複和繁重的“體力”勞動；AI智能的終極意義是幫助人擺脱重複的“腦力”勞動，幫助人更好的創新。在此目標下建立的可以信任的AI智能機器，可以跳出任何舊法律的束縛，而不應該受到懲罰。

/// END ///