智譜今天給十四億人發了台AI手機,好用嗎?_風聞
差评XPIN-差评官方账号-用知识和观点Debug the world!45分钟前
好消息,好消息!
各位差友們,村裏這下真的是發手機了!
不過不是在手裏,而是在雲上。

當然,這事也絕對不是普普通通的雲手機那麼簡單,不然我也沒必要這樣把大家給叫出來是吧。。。

不知道差友們有沒有過這種感覺:我們離一個真正的AI助手,好像永遠都差那麼“最後一百米”。
你讓它來定個鬧鐘,沒問題,用它來查個天氣,So easy。
可一但要整點複雜的操作,那人工智能就秒變成了人工智障。

想讓 Siri 去餓了麼上幫我點個奶茶,它開始搜索餓了麼的門店在哪裏???

我説前門樓子,它直接聽成了胯骨軸子,然後開始自顧自的幹活。
為了不讓 AI 的能力白白浪費,去年的時候,智譜這家公司整了一個好活,在別家的大模型還在只顧着卷着在做問答,寫代碼,編音樂,畫PPT 的時候。
人家直接開展了驚世智慧,一步到位,讓大模型來操作你的手機,只要扒拉扒拉嘴皮子,大模型就會理解你的想法,然後一步一步的操作手機來獲取信息。
去年的時候,就能用在我的手機上操縱小紅書來查攻略了

也能直接讓模型在手機上乾點實在點的事兒,比如説讓大模型來幫我點杯奶茶,甚至差評君還搶到過它給我發的紅包。

而今年,他們在這個基礎上又整了點花活,直接操作你的手機,已經滿足不了智譜了。
畢竟讓 AI 來直接操作咱們的是手機這件事,看起來雖然很酷,但是由於現在 AI 幹活的速度太慢了。
它操縱我的手機把活給幹完了,但那用的是我玩手機的時間啊!
這怎麼行!
於是為了避免這種資源浪費的情況出現,他們今年直接給大家一人發了一台雲手機和雲電腦,24 小時待命。我們只要動動嘴,它就能像一個真人一樣,在那個雲手機上幫你操作各種 APP,完成各種任務。
打開 AutoGLM App,就會看到這倆準備好的雲手機和雲電腦

不管是安卓還是 iPhone 用户都能用上,而且還不要錢。
差評君也私底下找智譜的朋友問了一下,問他們為啥這會發產品這麼豪橫,人人都能免費用。
結果人私下給我透了個底,説他們這模型背後用的都是自研的大模型,成本賊低。

跑一個任務背後的成本,大概在 0.2 美元左右。
大家可能對這個數字沒啥概念 ,這麼説吧,隔壁 Manus 同樣是做 Agent 的,就因為用了 Claude 的 API,跑一個任務大概得花2美元,是 AutoGLM 的十倍。
那麼價格打下來了之後, AutoGLM 幹起活來表現到底怎樣呢?我也幫大家簡單測了一下,就拿點飲料這個場景來説吧,我只需要直接表達想法:“幫我去美團上點五杯蜜雪冰城的檸檬水,並且直接下單。”

然後咱們就會看着雲手機開始哼哧哼哧一步步的操作:
先是打開美團,然後在搜索框裏輸入蜜雪冰城,然後開始進入店鋪,找到檸檬水,最後連點五次“+”號,將五杯檸檬水給放到購物車裏,然後讓我來做最後的買單確認的行為。
這裏的 GIF 是為了壓縮大小,有點加速

我只需要付錢就可以了,AI要考慮的可就多了。
其它像是買車票,訂酒店這些類似的場景,AutoGLM 都可以直接幫咱們操作,當然,還是和前面點奶茶的情況一樣,到了最後真正付錢的時候,還是得讓我親自來操作才行。
而且人不光能控制單個 App,還能在雲手機的不同 App 裏給來回轉跳,幫我把最實惠的產品給找出來。
就比如這回、我想買個羅技的 Mx Master 鼠標,就可以讓 AutoGLM 幫我去淘寶京東拼多多里逛一圈,然後幫我找到最有性價比的那一個。

而在收到了我的命令之後,AutoGLM 則是會自動的拆解任務,然後啓動的在隔壁的雲手機裏不斷的執行。

讓 AutoGLM 來幫我在不同的 App 裏查詢比價。

最後彙總出在各個平台上整理出來的結果,直接端上來給我。

雖然執行任務的速度可能看起來算不上很快,但是人畢竟是在專門的雲手機裏幹活的,不管幹的速度咋樣,都不影響我自己玩自己的手機。
如果説過去的大模型是在讓我們提高幹活的效率的話,那麼現在的 AutoGLM 就像是讓我們能直接一心二用,多線程操作。
更牛逼的地方在於,他們並不想把這種能力給侷限在自家的APP裏,而是通過開放API,把這個雲手機、雲電腦的控制權,交到了每個開發者手裏。

這就意味着任何可以和訪問網絡的設備,都可以通過 API 來訪問到 AutoGLM 裏的雲手機。
在看到這件事的第一時刻,我就想到了一個之前搗鼓過的開源項目 —— OpenGlass。
有沒有一種可能,不用手機,也能控制雲手機?
簡單介紹一下,這所謂的 OpenGlass,就是一個開源的小設備,可以通過外掛的方式,把我的眼鏡給弄成智能眼鏡。

雖然看着是有些粗糙對吧,但畢竟是開源項目,也管不了那麼多了。
於是我就申請了一下 AutoGLM 的 API,花了一個晚上的時間把它接進了 OpenGLass。
這樣一來,我就能通過直接説話的法子,跳過手機,直接讓眼鏡來幫我訂酒店。

買機票了

當然了,論項目的完成程度,差評君自己DIY出來的這麼個 AI 眼鏡模塊,肯定比不過市面上大廠成熟團隊做出來的產品。
而且看智譜這次放出來的消息,他們其實已經在和專門做智能眼鏡的廠商在做對接,可能都不需要一年,這類產品就會真正的走進現實。
但這回的折騰,更像是一次有趣的實驗,或者説是一次偷看。這麼個簡陋的眼鏡,在接入了智譜的 AutoGLM API 之後,我甚至感覺可能提前看到了下一代移動交互技術裏,一種可能演變的方向。
自打 2007 年初代 iPhone 問世,那個小小的 Home 鍵和一塊電容屏,就徹底定義了這種以觸摸為核心的交互方式。
就是這麼個如今大家習以為常的本能,讓蘋果將諾基亞斬於馬下,開啓了移動互聯網的黃金時代。

那麼,快 20 年過去了,當我們開始對滑動和點按感到麻木時,下一個能夠顛覆行業的交互方式會是什麼?
誰、又會成為下一個 iPhone?
這個問題,就是懸在所有科技巨頭頭頂的達摩克利斯之劍。沒人能給出確切的答案。
也正因如此,我們能看到一場無比精彩的軍備競賽:
蘋果推出了 Vision Pro 試水空間計算,Meta 從 VR 頭顯一路幹到和雷朋合作的智能眼鏡,谷歌重啓 Project Glass 尋求捲土重來,國內的廠商們也不甘落後:小米、雷鳥、Rokid 紛紛發佈各自的新款 AI/AR 眼鏡。

形態不一,功能不同,萬類霜天競自由。
沒有答案,但或許人人都是答案,或許真正能決定下一代移動設備平台的關鍵點,或許不光是在硬件本身,而是在硬件背後的靈魂裏:
那是一個能真正理解我們意圖,併為我們執行任務的 AI。
我們需要的不是一個戴在頭上的語音問答機,而是一個能像是 AutoGLM 這樣,能夠調動全世界資源來幫我們解決問題的賈維斯。

這條路如果能真的走好,走順,走穩當。
那或許,你的下一個手機,真的不只是一個手機了。
圖片、資料來源:智譜官網
