懂股票、愛計劃,體驗完Kimi探索版我回不去了_風聞
差评XPIN-差评官方账号-用知识和观点Debug the world!1小时前
OpenAI o1 發佈到現在,都快一個月了,但它給AI圈帶來的震撼和影響,其實才剛剛開始。
反正圈內的不少大佬,直接就給 o1 來了一頓猛猛誇。大模型拆解用户提問的能力,還有深度思考的能力,已經成了大夥們卷的一個新方向。
但與此同時,就像在等《 黑神話 · 悟空 》發售一樣,不少網友也和差評君一樣猴急,盼着國內的大模型們,何時能有類似的產品出現。

也有差友在公眾號後台,一直私信,表示自個都被 o1 釣成翹嘴了,現在是吃不飽、睡不香,只想在國內也用到類似深度思考的功能。

然而這一次,差評君發現還真有人給整出來了。。。
它便是年初,才剛掀起圈內長文本競賽的 Kimi ,而這次他們發佈的 Kimi 探索版,可以模擬人類的推理思考過程,自主分解複雜問題進行深度搜索,還加上了即時反思的功能,幫助用户完成分析調研。
更重要的,這次探索版,搜索量達到了普通版的 10 倍,一次搜索甚至可以精讀 500 個頁面。
翻譯一下,以前我們向 AI 提出複雜的提問,得在腦子裏把預想的問題人為拆一下,讓 AI 一個一個答。而現在,不僅解放了雙手,還可以一次窮盡更多信源,只需想好問題, Kimi 就會像個分析師一樣來為你服務。
難怪產品負責人説, “ 如果 Kimi 搜不到的信息,大概率用户也很難自己通過傳統搜索引擎找到答案 ” 。

今天一大早, Kimi 探索版在 PC 端開始了灰度測試,據説手機端很快就會上。
結果,用户的火爆很快把 “ Kimi 崩了 ” 送上熱搜。
官方也很快發了致歉公告,並預告一下大概在週一,探索版的功能就會全量開放。

先給前段時間斷了網的差友們,用幾句話簡單介紹一下 Kimi 的來頭。
這麼説吧,差評君願意把它稱之為國產大模型的一束光,光是在 PC 網頁端,今年以來 Kimi 的月訪問量就從 140 多萬漲到 2400 多萬,增長了 1670 % 。
爆火到他們服務器一度宕機。資本市場,甚至還炒作起了 Kimi 概念股。。。

這次發佈的 Kimi 探索版,某些方面其實和 OpenAI o1 有點類似,那就是會解難題、懂思考了,但差評君覺得,它和 o1 還是有不少差異的。其中最大的不同,便是在使用場景上。
OpenAI o1 主打的,是能回答博士級別的問題,解比如物理、數學、生物上的難題等等。不過也因為這兒,差評君當時在用上 o1 的第一時間,其實憋了好幾個題目沒敢問。
畢竟 Preview 版本一週只能提問 40 個問題,我生怕問得簡單了,配不上博士級別的模型,浪費了額度。。。
好在差評君靠人脈,找來了好幾位博士,**和他們聯手和砍拿下三雙給 o1 上了一波壓力。**當然,最後博士們對 o1 的評價,也是相當高。

而這次 Kimi ,則選擇了另外一條更實用、更**接地氣的道路,**那就是把思考和拆解問題的勁兒,聚焦在是和咱們普通人更近的生產力場景上,尤其是大學生、上班族們常乾的調研分析類任務。
在體驗了一番之後,我的評價是,如果 AI 也有 MBTI 的話:那它活脱脱就是一個思維和計劃縝密 & 執行力強的 J 人。

首先,差評君發現, Kimi 探索版在解答問題時,真就和人思考時一個樣。
它會拆解長難提問,自己規劃解答思路,最後分步驟並執行任務。
就比如説國慶假期一過,在座的各位巴菲特們,估計股票賬户裏都是一片紅。
差評君給 Kimi 探索版的第一題便是:如果我們在 5 年前,分別花了 10 萬人民幣,買入了比亞迪股票、茅台股票、還有黃金,現在它們分別價值多少?
説實話,這題對咱們普通碳基生物而言,其實並不複雜,主要就是步驟有點多,得花個小几分鐘才能算清楚。

而 Kimi 探索版把差評君的問題,成功拆解成了三步:先分別查 5 年前的價格,再查當天的價格,最後計算並製表。
Kimi 也是三下五除二,在一分鐘不到的時間內,一步步得出了結果。
差評君也才知道,《 只 》要在 5 年前買入 10 萬人民幣的比亞迪股票,這會兒已經價值 70 多萬了。

其實類似的問題,差評君其實也甩個隔壁的 Perplexity 試了試。。。但且不説表格沒畫清楚了,它抓取的五年前的股票和黃金價格,相比實際價格都偏差了不少。
它的表現,我只能説 not even wrong 。

大概清楚了 Kimi 探索版能力的深淺之後,差評君也立馬給 Kimi 上了一波難度。
説實話,出去玩兒的時候,攻略往往是最燒腦和最讓人頭疼的了。
於是我的第二問便是:幫我查詢 9 月北京環球影城各個遊樂項目,在一天不同時段的平均排隊時長,列出表格,再根據這個設計一條耗費排隊時間最少的遊玩路線。
光是看到這個題面,我就感覺自個兒的頭髮在不停地掉。。。
Kimi 則依舊穩如老狗,給出了搜遊樂項目、搜索平均排隊時長、設計路線這三步走的思考過程,並在閲讀了 53 個網頁後,按步驟來了一波解題。

最後的結果,也還真是井井有條。
相同的問題,差評君也在其他幾款主流的 AI 助手裏試了試,而我看到最多的兩個字,卻是 “ 抱歉 ” 。。。

隨後,我也趁熱打鐵,給 Kimi 整上了網上那些讓人抓狂的諮詢機構面試題。
其實這類題目,往往都沒有絕對的正確答案,它們考察的就是應聘者臨場的邏輯思維、數據分析、問題解決和溝通表達能力。
大夥們也可以看一看 Kimi 的回答,能不能讓在座的各位面試官們信服。
問題:中國 2023 年的社會用電總量如果都用太陽能發電,需要多少平米的太陽能板,面積相當於幾個足球場?

問題:如果所有鋼琴都定期調律,估算一下北京需要多少名全職的鋼琴調律師?

除了拆解和解決問題的能力,差評君還發現, Kimi 探索版在信息的大量收集方面,簡直就是啓動了 V8 引擎,突出的就是一個馬力十足,能一次搜索幾十個關鍵詞,閲讀幾百個網頁。
就比如説,諾貝爾獎正在陸續頒獎中,如果讓一個普通的碳基生物,彙總一下近十年所有諾貝爾物理學獎得主的姓名、生卒年月、還有國籍,並且統計出他們的平均獲獎年齡。
反正看到這活兒,差評腦袋裏已經出現瀏覽器被幾十上百個網頁塞滿、電腦開始卡頓的畫面了。

而同樣的問題交給 Kimi ,在短短不到 1 分鐘的時間內, AI 一次性搜索了幾十個諾貝爾獎得主的信息,並且閲讀了 200 多個網頁,從中彙總出來咱們想要的信息。
最後 Kimi 也是沉着冷靜,給出了計算結果:近十年諾貝爾物理學獎得主的平均得獎年齡,在 75 歲前後。

而 “ 在 2024 年《 財富 》中國科技 50 強企業中,哪些公司的總部在北京? ” 這個問題中,差評還發現了個有趣的現象,那就是 Kimi 正答着題目呢,自個兒就開始反思了。。。
在反思一番後,又補充上了兩個答案。
要是差評君當年高考時,也這麼嚴謹地驗算,這會兒應該不是個律師就是個醫生了吧。

另外差評君覺得,其實很多時候,咱們還有很多模糊搜索的需求。
特別是熬夜看球、通宵打遊戲了之後,經常記性不太好,常常連問題本身都記不太清了。。。
就比如前段時間,差評君想找個數學家的資料,但他的名字感覺就在我嘴邊,但卻死活想不出具體名字。只依稀記得了幾個特徵,那就是:屬於歐洲的一個家族,哥哥、弟弟、父親都是數學家,他們互相之間還嫉妒彼此。
結果 Kimi 立馬就成功發現,我要找的是數學家伯努利,還順帶把他們的 “ 族譜 ” 的都列出來了。
同樣 Kimi 也在答題時,也進入了反思和補充環節,給回答又加了億點點細節。
提問:歐洲有一個家族,哥哥、弟弟、爸爸都是數學家,他們互相之間還嫉妒彼此,這個家族叫啥名字?展示一下他們各自的成就。

包括有時候記不起具體的公司名,咱只要還記得一些故事和細節,也能順暢地搜索。
問題:上個世紀有個硅谷公司,做過類似 iPhone 的產品,這個公司叫什麼,這個公司的早期員工後來參與了哪些重要公司的創立。

總的來説,綜合體驗一波 Kimi 探索版後,差評君覺得 AI 幫助用户解決的問題範圍,有了指數級擴展,真的多了一位可以幫着快速收集、調研和分析的私人助理。對傳統搜索來説,也是一種顛覆。
説實話,從年初 Kimi 掀起的長文本競賽,咱就不難看出,其實除了那些 Benchmark 分數、排行榜,普通用户最在意的,還是大模型到底能給大夥們解決怎樣的痛點。
畢竟有了真正好用的工具,才好在發現和創造過程中,探索更大的世界。
所以 Kimi 探索版,真的讓我回不去了。
圖片、資料來源:
Kimi 官網 、Kimi 官微
