2024年智能終端大戰開啓:Vision Pro?AI手機?還是?_風聞
酷玩实验室-酷玩实验室官方账号-01-29 09:58
15年前,電影《阿凡達》在全球院線上映,這部作品堪稱3D電影的技術奇蹟,為觀眾帶來了媒體歷史上最為沉浸式的觀影體驗,該片也以全球票房約29億美元的成績,位列全球影史票房成績第一名。

但是電影上映後不久,美國有線電視新聞網(CNN)報道了一種奇特的現象,部分人稱之為後《阿凡達》抑鬱症(post-Avatar depression syndrome)。由於影片的沉浸式體驗過於強烈,一些觀眾在離開影院時,紛紛表示感受到了一種空虛,彷彿還置身於潘多拉星球。
甚至有一位影迷在論壇上發帖表示,“自從看完《阿凡達》之後,我就一直很沮喪。看着奇妙的潘多拉星球和那美剋星人,我想成為他們中的一員。我甚至開始考慮自殺,我覺得如果我死後會在潘多拉星球上重生,就像阿凡達那樣。”可怕的是在這個帖子下,居然有1000多條網友回覆,他們都抱有類似的想法。
白駒過隙,隨着Meta、HTC和索尼等公司虛擬現實VR產品獲得初步成功,混合現實MR體驗逐漸普及,許多產品的用户也出現了類似現象。體驗越加真實,當用户摘下頭顯時,反而感到愈發不適。
1月19日,蘋果Vision Pro正式發售,售價25000元起,備受矚目。然而,這款產品在發售之初便迅速售罄,乃至引發搶購熱潮。
在京東平台,Vision Pro價格飆升三倍之多,達到了驚人的89999元。可見大家都很想體驗下庫克(cook)廚子口中的“One more thing”的超強混合現實體驗。

除此混合現實之外,隨着ChatGPT為代表的AI大模型的興起,硬件設備與AI的深度融合,成為了另一條備受期待的發展路徑,AI+硬件,又是否會在2024年給我們帶來驚喜呢?
一場圍繞**“下一代智能硬件”的定義權**大戰,正悄然拉開序幕。
01****蘋果“空間計算”的野心這幾年蘋果對自家消費級硬件的更新,每年的發佈會什麼樣大家也都看在眼裏。雖説每一代都有令人“Amazing”的提升,但也逃脱不了“擠牙膏”、“刀法精準”、“就這?”等負面評價。
大體從iPhone12開始,手機的外觀基本定型,每年的iPhone發佈部分就總是“三攝鏡頭模組、芯片SOC、手機操作體驗”三件套升級,以至於有的博主已經預測出來明年iPhone16要更新哪些東西了。

外部也在猜測蘋果天天“擠牙膏”的原因,有的人説喬幫主一走,蘋果真的江郎才盡,“創新已經結束”的論調甚囂塵上;還有一種説法則是,蘋果覺得手機的形態已經走到盡頭,創新的研發主力已經轉移到更加面向未來的項目之中。
如果你對蘋果十分關注,你會發現2023年9月iPhone15的蘋果發佈會亮點相較往年更加少了。但如果你想在發佈會中尋找蘋果為Vision Pro所做的鋪墊,那麼其中所藴含的信息量還是相當大的。
首先,在最新款的Apple Watch中,引入了一款四核神經引擎。為何一款僅限穿戴的設備需配置如此高性能的芯片?原因在於手錶新增了手勢識別功能。通過拇指與食指的簡單捏合點擊,用户可實現諸如接聽、掛斷電話、啓動或關閉鬧鐘等控制操作。

然而,我們再來看看Vision Pro的宣傳片,是不是交互方式很相似?習慣成自然,用久了Apple watch,再用Vision Pro也就順理成章了。
唯一的問題是這個動作,對韓國消費者態度不夠友好……
再有就是關於生化危機、刺客信條等大型遊戲登錄iPhone,甚至在手機上來了一出“原神啓動”,這個舉動不禁令人質疑:難道蘋果也突然關心我們這些臭打遊戲的了?
而且在2023年6月的WWDC,蘋果把知名遊戲製作人小島秀夫拉到了現場,《死亡擱淺》也放到了蘋果Mac上來。

然後蘋果還給電腦搞了一個遊戲移植工具包,可以讓遊戲開發者輕鬆地把其他平台上的遊戲在蘋果電腦上運行。

要知道這幾年,遊戲開發所依賴的基礎工具已日臻完善且繁雜多樣。蘋果想打造一款通用型的移植工具,勢必得讓各類技術工具與蘋果Metal圖形加速體系實現逐一匹配,這個工程量有多大不言而喻。那麼,為何要投入如此巨大的精力,將大型遊戲納入蘋果生態呢?
如果我們把視角再擴大一些,就可以看到微軟這兩年來也對單機遊戲產生了濃厚的興趣。轟轟烈烈的暴雪收購案也在國內受到了廣泛關注,這並非偶然,不是遊戲產業有多香,而是巨頭們為了在下一代個人消費電子終端的競爭中佔據先機。

一言以蔽之,巨頭們認為下一代的終端很可能是沉浸式的,所以他們必須牢牢把握住現今最沉浸的內容生態,也就是大型遊戲。
除此之外,蘋果還藉助混合現實MR普及的趨勢,適時地提出了**“空間計算”**這一概念。
空間計算,我們可以簡單地理解為把虛擬內容和現實世界,無縫銜接的技術。是包含了計算機視覺、人工智能、混合現實(MR)、虛擬現實(VR)、傳感器技術以及高級圖形處理的一個大的集成。

空間計算設備的技術需求,包括環境感知與交互、混合現實體驗、高級圖形處理以及自然用户界面等功能,這與手機APP的平面UI設計有着本質區別。
而如今,具備這類技能的人才主要集中在大型單機遊戲公司中。對於新的內容生態來説,人才是最為至關重要的資源。當眾多開發者選擇使用某一種工具或平台,它就會逐漸形成行業標準和生態系統。
那麼蘋果發力遊戲,也就不難理解了。
其實早在2015年,為了專注於Vision Pro的開發,蘋果公司就成立了一個專門的部門——Vision Products Group(原來叫TDG)。這個小組包括軟件和硬件工程、戰略、計算機視覺、內容、應用開發和項目管理團隊。技術上蘋果的鋪墊也很多,包括蘋果手機的激光雷達功能、AirPods的空間音頻和一直更新到的AR kit6,都支持引入4K的視頻了。蘋果公司還在過去的幾年中獲得了5000多項專利,推動技術創新和市場拓展上的進步。

這真的是為了Vision Pro“這碟醋”,才包了這一大堆餃子。
現代的個人智能終端,演進方向大多都是更大的屏幕和更直覺的交互,最終目的就是**讓人們接收和處理更多信息。**如果沿着這個方向發展,Vision Pro呈現了一種不同於其他終端的全新維度。因為Vision Pro的屏幕尺寸可以視為無限,通過更加直觀的手勢交互,用户甚至可以實現手寫輸入,從而極大地提升了工作效率和便捷性。

這表明了什麼?這表明它**不僅能在以後顛覆個人移動設備,還極有可能顛覆個人內容消費市場。**只要芯片算力持續提升,遊戲、電影、電話、文字處理、PPT製作以及網頁瀏覽等所有功能,都可以在這個空間中實現,在你帶上Vision Pro之後可以説,整個世界都是你的桌面。
蘋果並非最早嘗試混合現實這一領域的公司,然而不難看出,它的野心是真的很大。
但不管蘋果本身的想法如何,最終還是要落實到用户的體驗上,而大家對於Vision Pro佩戴舒適度的擔心,以及對於用户能否接受它那種全新的操作方式的擔心,也是不絕於耳。正好我已經買到了Vision Pro,不久之後會給各位帶來實機體驗,歡迎關注我們的賬號。
02****AI Pin的另一種解法:****環境計算在過去的十年裏,人們對侷限於智能手機的世界感到沮喪,如今世界是否已準備好將關注點轉向其他硬件領域?針對這個問題,初創公司Humane給出的答案與蘋果6 月份通過Vision Pro向世界展示的截然相反——他們要讓人們從屏幕中徹底解放出來。
他們給出了硬件的答案——AI Pin。作為初創公司Humane的首款產品,是一款可佩戴在衣物上的人工智能設備。AIPin計劃於2024年3月起開始發貨。

這個造型,就像2013年的電影《雲端情人》裏面的智能助手薩曼莎(Samantha)一樣。

這款方圓型設備配備了攝像頭、麥克風以及深度和運動傳感器,以語音控制為核心功能。用户需通過語音喚醒AI並與之交流。激光墨水顯示屏是單色的,它能將諸如來電等文本信息實時投射到用户的手掌之上。AIPin的設計理念,在於無需依賴智能手機即可獨立使用。

其實早在2023年5月,Humane的創始人Chaudhri發表了一場題為“消失的計算機:Humane無屏技術的獨家預覽”的TED演講。他在演講中表示:“未來,技術將既是環境的,又是情境的,這意味着利用人工智能來真正瞭解用户及其周圍環境,以達到最佳效果。”
我們在之前的視頻中,就曾經説過AI pin就像現在的“小王”秘書一般。但是再深入研究一下,我們就能知道它所藴含的概念性意義——環境計算。
就像硬件光譜的另一個極端一樣。環境計算,指的是計算技術在日常環境中無縫融入,以潛移默化的方式為用户帶來智能支持與服務。與空間計算更側重於空間數據的處理與分析不同,**環境計算致力於打造智能、自動化的生活和工作環境。**就像小米之家的各項智能傢俱,雖然沒有屏幕,但是都很智能。

那麼沒有屏幕只用語音,是否讓AI Pin的交互變得完美呢?
事實上,各種前車之鑑都已表明,智能硬件完全依賴語音交互是很不靠譜的。不説別的,在嘈雜的環境環境中,語音命令的接收和正確識別就是個大問題。

(走秀還是很帥的)
顯示部分使用了**“激光墨水顯示器”**來將內容投射到用户的手掌上,雖然頗有幾分未來感。但他僅僅是一個分辨率僅720P的單色畫面。在如今各類視頻圖片等內容數量已經極為豐富的情況下,單色顯示已經很難滿足用户的需求。
最後還有個很現實的問題:如果手機也實現了大模型的無縫接入,那麼AIPin的獨特的吸引點是什麼?難道是不用盯着屏幕嗎?
因此在我看來,AI Pin仍可視為偏向概念性的產品,其更適合扮演輔助角色的定位,將各類電子產品相互關聯,但短期內尚無法替代手機功能。AI Pin的實際應用價值,確實還需進一步觀察。就像科技博主Om Malik(奧姆·馬利克)所説:
“當iPhone推出時,人們對觸摸屏作為界面的概念不乏懷疑。我仍然記得人們對虛擬鍵盤的強烈抗拒。十五年後,沒有人再對智能手機的顯而易見感到驚訝。再過幾年——得益於人工智能,語音將成為我們數字交互現實的一部分。它不會是唯一的方式,但它將是重要的一種方式。”
不論這款產品最終成功與否,就像AIPin 的發佈會結束時説的:這只是一個嘗試和開始。
順便説一下,AI Pin的測評我也會在它正式發貨之後給大家帶來,歡迎關注。
03AI大模型的搭載讓智能手機真的變“智能”比起硅谷對未來的探索,更為現實的一步,是如何將AI大模型裝進現有的智能硬件中。
今年開年,三星就發佈了他們的新一代高端旗艦系列產品三星Galaxy S24 系列。在全新三星Galaxy S24系列手機上,AI功能成為了一大亮點。這款手機深度集成了AI大模型,全面優化了輸入、通話、錄音、筆記和相機等常用功能。

回看國內,在2023年下半年,手機廠商也開始將AI捲進自家系統。先是Mate 60Pro宣佈接入盤古大模型,然後是小米的澎湃AI、Vivo的藍心大模型,OPPO的安第斯大模型……每家手機都在開發並接入大模型。

憑藉AI大模型的支持,智能手機不僅可以成為用户的個性化數字助手,還可以顯著提升對複雜語義和語境的理解能力。手機廠商們都有一個設想:都希望自家的手機成為的“私人助理”,每人配一個鋼鐵俠的“賈維斯”,豈不美哉?
但手機部署大模型到目前為止還有一個無法繞過的問題,那就是大模型的計算成本。

Vivo副總裁周圍在藍心大模型的發佈會採訪中表示,對於智能手機來説,在終端部署大模型幾乎不用考慮成本,但大模型上雲的單次成本是可以明確計算的,大約為單次0.012元或0.015元。如果按3億用户每天使用10次計算,那麼一天就要花費至少3600萬元,一年就是100多億元。
那這100多億,由誰來出呢?
所以一個很現實的考慮就是,儘量在手機上(端側)實現大模型的計算,因為相比之下,端側計算成本更可控,並且由於數據不用上雲,安全隱私性更強,而且計算效率也更高。不過,端側計算卻對手機硬件提出了更高的要求。一般而言,大模型肯定是越大越好,這代表着推理結果會越精確。
但是,硬件的誕生往往是妥協的產物。AI大模型的參數是巨大的,手機的內存、核心處理器的計算能力卻是有限的。
1B的數據在手機上會佔用1個G的運行內存,而當數據量達到13B,運行內存佔用就會超過7G。如今大部分高端手機的RAM是12G或16G,這意味着一個很好用的大模型要在手機端側實裝,可能佔掉大約一半以上的內存,很可能影響手機的流暢使用。
大模型對手機的挑戰遠遠不止內存。**大模型計算同樣對SOC芯片計算能力提出了更高的要求。**當前,行業內可供AI大模型採用的芯片不多,目前也只有聯發科天璣9300和高通驍龍8gen 3芯片能支持大模型的端側落地。

這些大模型對於手機內存和芯片的限定要求,也註定了在短期內,手機端大模型只會是高端手機的專屬體驗。
不過,芯片廠商們也敏鋭識別了手機廠商的訴求。比如,前段時間高通就在驍龍8 gen 3上提升了AI計算能力,不僅能支持運行100億參數的模型,還針對70億參數LLM每秒能夠生成20個token,這意味着各類虛擬助手、GPT聊天機器人未來都能在手機等終端運行。
而對於大模型能否在手機成為“智能助手”,其實還包括手機隱私數據、用户信息能否在AI數據的應用深層次地調用。

例如你想讓AI助理幫你買張機票,它就至少要調用你的身份信息,支付信息和日程信息。而這些也是APP應用商手中最敏感的數據,想要讓AI能夠完全調用各種用户的私人信息,目前還是困難重重。
AI大模型在手機領域的普及仍然進展緩慢,目前的努力只是探索之旅的初步階段。各大手機廠商要想讓AI大模型和手機充分融合,成為真正的智能終端,仍有很長的路要走。
混合現實、環境計算、AI手機,我不知道這些人與機器繼續共生的探索,到底哪個會成為主流,我們唯一能確定的是,一個全新的時代正在到來。