烏鴉AI日報:快手、百度地圖上線蘋果Vision Pro_風聞
乌鸦智能说-29分钟前
快手推出蘋果Vision Pro版本應用,可以多開屏幕和頁面,實現“邊刷視頻邊評論”。百度地圖也上線了“百度地圖時光機”的Vision Pro應用,用户可體驗360度全景地圖。
Runway最新推出的Gen-3Alpha視頻生成模型在保真度、一致性和動作表現方面有重大改進,不僅生成穩定光影,還展現強大想象力,內測博主展示了3D巨幅字幕效果。
過去的一天,國內外AI行業還有哪些熱點值得關注呢?讓烏鴉君帶你一起看看吧。
/ 01 / 大模型
1)Meta最新發布的LLM Compiler,實現77%自動調優效率
Meta發佈開源模型LLM Compiler通過優化編譯器設計,實現了77%的自動調優效率,顯著提高代碼編譯的速度和效率;該模型在反彙編任務中表現突出,成功率達45%,為逆向工程和舊代碼維護提供了強大工具;該模型在龐大的LLVM-IR和彙編代碼庫上訓練,增強了對編譯器中間表示和彙編語言的理解。
2)智譜稱國產大模型GLM-4-9B性能超過了谷歌Gemma
針對谷歌新發布的Gemma-2開源模型,國內大模型獨角獸智譜 AI 向媒體展示一份數據稱,提供的各項評測對比中,近1個月前發佈開源的國產大模型GLM-4-9B似乎更具有優勢。具體來説,在語義、數學、推理、代碼和知識等多方面的數據集測評中,GLM-4-9B-Chat版本均表現出較高的性能。
3)面壁智能助力全國首個司法審判垂直領域大模型誕生
面壁智能宣佈,全國首個司法審判垂直領域大模型於深圳誕生,深圳市中級人民法院上線運行人工智能輔助審判系統,能夠精確診斷案情,解決AI在司法領域的應用難題。深圳法院人工智能輔助審判系統具有全流程AI賦能、材料入口要素化、首創樹狀提示詞工程、權威知識服務體系、裁判思維鏈路標準化等亮點。
4)榮耀與字節豆包大模型達成合作
火山引擎宣佈榮耀與字節豆包大模型達成合作。火山引擎首先為其提供了包含語音識別、角色扮演等多款模型在內的豆包大模型家族,構建榮耀垂直模型落地應用的基礎能力。在智慧辦公領域,豆包大模型可幫助榮耀為用户提供基於文檔理解的互動問答、會議紀要以及輔助創作等功能。
5)Runway Gen 3可生成電影片頭3D巨幅字幕效果
Runway最新推出的Gen-3Alpha視頻生成模型在保真度、一致性和動作表現方面有重大改進,不僅生成穩定光影,還展現強大想象力。內測博主展示了3D巨幅字幕效果,Gen3即將對所有人開放使用。
6)GPTPdf:使用類似GPT-4o的多模態LLM分析PDF文件
開源項目“GPTpdf”在Github爆火,它使用了類似GPT-4o的VLLM模型解析PDF文件並轉換為Markdown格式。該項目代碼簡潔高效,只有293行,卻能完美解析排版、數學公式、表格、圖片、圖表等各種內容。費用每頁平均成本為0.013美元。
/ 02 / AI應用
1)蘋果或正在將Apple智能引入Vision Pro
科技記者Mark Gurman最新報道,蘋果的人工智能套件“Apple智能”即將登陸Vision Pro頭顯,不過相關功能預計在明年才能推出。Vision Pro具有16GB內存來支持Apple智能運行,並且其操作系統visionOS本質上也是iPadOS的變體,因此Gurman認為,為頭顯適配Apple智能的難度不會很大。
2)快手、百度地圖時光機上線蘋果Vision Pro頭顯
快手官方宣佈,推出蘋果Vision Pro版本應用,可以多開屏幕和頁面,實現“邊刷視頻、邊瀏覽個人主頁、邊開啓評論面板”。百度地圖也上線了“百度地圖時光機”的Vision Pro應用,用户可以在應用中體驗360度全景地圖,用户視野向下,可查看當前地圖的時間及地點信息,“雙手合十”可切換眼前場景。
3)百度:近八成考生用AI填報志願
百度官方發佈的數據顯示,僅6月25日一天,就有超過1000萬用户使用了百度AI志願助手,輔助填報志願。據悉,高考結束後,全國有超1300萬考生陸續進入高考填報志願環節。此外,夸克App也推出了智能選志願服務,靠譜AI推出了國內首款多個大語言模型加持的志願填報AI工具。
4)字節跳動發佈豆包MarsCo智能開發工具
字節跳動發佈了基於豆包大模型打造的智能開發工具豆包MarsCode,面向國內開發者免費開放。MarsCode包括編程助手和Cloud IDE兩種產品形態,支持超過100種主流編程語言,可在需求開發、修復Bug、開源項目學習三個場景中實現項目問答、代碼補全、單測生成等功能。
5)熱門AI搜索工具Perplexity被指引用錯誤信息
AI搜索工具Perplexity被曝引用錯誤的AI生成垃圾信息,這些信息來自LinkedIn文章。初創公司GPTZero發現Perplexity鏈接的來源中有越來越多是AI生成的,甚至會使用這些來源中的過時和不正確信息。
6)奧迪微軟強強聯手:約200萬輛汽車即將接入ChatGPT
奧迪計劃從今年7月起為約200萬輛汽車接入ChatGPT技術,以提升車輛的語音控制功能。配備模塊化信息娛樂系統(MIB3)的奧迪車型將通過ChatGPT,允許車主在駕駛時使用自然語言查詢信息。新車型如Q6 e-tron以及未來搭載E3 1.2電子架構的車型,將接入ChatGPT,擴展奧迪助手的功能。
7)知乎AI搜索功能正式產品化:發佈AI產品“知乎直答”
知乎發佈最新的AI產品“知乎直答”。“發現·AI搜索”則是基於“知海圖AI”大模型能力,推出的一款集新搜索、實時問答和追問功能於一體的嚐鮮版AI搜索功能。知乎官方也預告,接下來“知乎直答”將逐步推進App開發和多模態能力的引入。
8)CharacterAI推出新語音功能,可以給AI角色“打電話”
Character.AI推出了能與AI角色進行實時語音通話的功能,支持多種語言包括英語、西班牙語、和中文等;這項功能通過超過300萬用户的測試,確保了通話體驗的自然流暢性,與真人聊天無明顯差異;Character.AI還增強了AI角色的現實感,用户可以選擇或創建超過100萬種獨特的聲音。
/ 03 / 投融資情報
1)AI文檔搜索公司Hebbia完成近1億美元B輪融資,估值達8億美金
據TechCrunch報道,三位知情人士透露,一家研發生成式AI搜索大型文檔工具的初創公司Hebbia,近日已完成由Andreessen Horowitz(a16z)領投的近1億美元B輪融資。
2)吳恩達計劃為其AI基金繼續籌集1.2億美元
吳恩達計劃為其AI基金籌集超過1.2億美元,展現了他在人工智能領域的持續投入和影響力。這一舉動也反映了人工智能行業的發展趨勢和潛在泡沫風險。
3)OpenAI據悉聘請Zapier原首席營收官擔任銷售戰略負責人
據報道,知情人士稱,OpenAI正在擴展其企業軟件業務,擔任企業軟件提供商Zapier首席營收官兩年多的Giancarlo Lionetti已加入OpenAI,擔任銷售戰略負責人。
/ 04 / AI基礎設施
1)軟銀孫正義計劃籌措1000億美元成立AI芯片企業
根據今年2月的媒體報道,軟銀正在制定一項計劃將約1000億美元投入到AI相關芯片中的計劃,該項目被命名為是“伊邪那岐”。上週,當某股東問及“伊邪那岐”時,孫正義表示,他將致力於取得成果,並將努力實現自己設定的目標,但沒有詳細説明。
2)微軟AI負責人:未來知識生產成本將降到邊際成本為零
微軟AI首席執行官穆斯塔法·蘇萊曼示,對於許多開放網絡上的內容,默認的社會契約是允許這種使用的。現有知識產權法在某種程度上有寬鬆性,在AI時代這種寬鬆性面臨挑戰。蘇萊曼認為,信息經濟學即將發生根本性的變化,“因為我們將把知識的生產成本降低到邊際成本為零”。
3)加速視頻生成新方法PAB:可實時生成視頻,每秒21.6幀
這篇文章介紹了新加坡國立大學和普渡大學研究人員成功提出的PAB技術,實現了基於擴散式轉換的視頻生成的實時處理。該技術通過減少冗餘的關注計算,實現了高達21.6幀每秒的生成速度,加速了10.6倍,同時適用於多個熱門的DiT視頻生成模型。
4)首個多模態視頻競技場Video-MME發佈
首個多模態LLM視頻分析綜合評估基準Video-MME發佈。在其基準考試中,Gemini 1.5 Pro一路遙遙領先,在全新的、更復雜的多模態考試中大獲全勝,全面超越了GPT-4o。
5)Sam Altman:AGI或在十年內實現全球GDP翻倍
OpenAI CEO Sam Altman認為AGI可能會使全球GDP翻倍,同時他還聲稱“這對我來説是合理的,肯定與其他技術革命一致。我們確實認為這將是一個巨大的生產力驅動因素,甚至在早期階段,我們已經看到人們用它來極大地改進產品和服務”。