烏鴉AI日報：OpenAI靈魂人物Ilya創辦SSI_風聞

乌鸦智能说-41分钟前

2024-06-21

前OpenAI首席科學官Ilya Sutskever宣佈成立致力於開發安全超級智能技術的企業Safe Superintelligence（SSI）。Sutskever表示，SSI的第一個產品將是安全的超級智能。

根據GS Statcounter數據，截至今年4月，谷歌的搜索引擎市場份額降至86.99%，是自2009年以來的最低點，似乎是受通用AI助手和新AI搜索玩家影響。

過去一天，國內外AI行業還有哪些熱點值得關注呢？讓烏鴉君帶你一起看看吧。

/ 01 / 大模型

1）北大推出全新機器人多模態大模型，面向通用和機器人場景的高效推理和操作

HMI Lab依託北京大學視頻與視覺技術國家工程研究中心等平台，推出端到端機器人MLLM—RoboMamba，它利用 Mamba模型提供機器人推理和行動能力，同時保持高效的微調和推理能力。研究人員將視覺編碼器與Mamba集成在一起，通過共同訓練將視覺數據與語言嵌入對齊，使模型具有視覺常識和與機器人相關的推理能力。

論文：RoboMamba: Multimodal State Space Model for Efficient Robot Reasoning and Manipulation

2）英偉達的Lumina-T2X圖像生成應用於Confyui中

基於Stable Diffusion開發的ConfyUI開始使用英偉達的Lumina-T2X圖像生成技術，從試用來看，開源模型Lumina-T2X在美學表現和圖像質量上與業界領先的MJ V6相差無幾。

3）首個AI高考評測出分，GPT-4o拿下第二名

上海人工智能實驗室和司南評測體系發佈了AI模型參加高考“語數外”全卷能力測試的結果。該測試選取了6個開源模型以及GPT-4o進行，採用了全國新課標I卷。評測結果顯示，Qwen2-72B、GPT-4o及書生·浦語2.0文曲星（InternLM2-20B-WQX）三個模型成為前三甲，得分率均超過 70%。

然而數學科目全員不及格，InternLM2-20B-WQX得分75（滿分150）最高，超過GPT-4o的73分。

4）Kimi將啓動Context Caching上下文緩存內測

Kimi宣佈，Context Caching功能即將啓動內測。這一創新功能將支持長文本大模型，並通過高效的上下文緩存機制，為用户提供前所未有的體驗。Context Caching技術可以通過緩存重複的Tokens內容，大幅度降低用户在請求相同內容時的成本。

5）中國電信發佈單體稠密萬億參數語義模型Tele-FLM-1T

中國電信人工智能研究院（TeleAI）聯合北京智源人工智能研究院，發佈全球首個單體稠密萬億參數語義模型Tele-FLM-1T，成為國內首批發布稠密萬億參數大模型的機構。結合模型生長和損失預測等技術，這一系列模型在算力資源的使用上，僅消耗了業界普通訓練方案的9%。

/ 02 / AI應用

1）谷歌搜索份額降至86.99%，或受通用AI助手和新AI搜索玩家影響

根據GS Statcounter數據，截至2024年4月，谷歌的搜索引擎市場份額似乎已降至86.99%，是自2009年以來的最低點，很大程度上谷歌的份額正在被通用AI助手和新的AI搜索玩家所蠶食。

2）AI獨角獸月之暗面進軍北美，推出2款AI新產品，虛擬陪伴和音樂視頻生成工具

月之暗面一直在開發針對美國市場的產品，包括在蘋果和谷歌應用商店上架的人工智能角色扮演聊天應用Ohai，以及音樂視頻生成器Noisee的網站。目前還不清楚這家初創公司何時會推出海外版聊天機器人。

據悉，月之暗面在中國的主要競爭對手之一MiniMax已經通過人工智能聊天應用Talkie在美國拓展業務。

3）TikTok推AI內容工具套件，寫腳本、剪視頻、數字人全包

TikTok推出Symphony AI內容工具套件，該套件能在60秒內生成多種TikTok視頻預覽，支持多語言翻譯和視頻編輯。Symphony Digital Avatars幫助品牌擴展創意策略，提供真實人物頭像。套件還可以發現趨勢、提供創意指導、激發靈感、編寫腳本，並給出優化建議。

4）AI生圖可“量身定製”！華為清華聯手推個性化生成技術PMG

華為與清華大學合作推出了名為PMG的個性化生成技術，該技術利用用户歷史行為和偏好，生成符合用户需求的多模態內容，如表情包、T恤設計圖、電影海報等。

5）百度文庫新產品橙篇支持10萬字長文生成

百度文庫宣佈，全新產品“橙篇”首創10萬字長文生成及多模態編輯能力。據介紹，在超長圖文理解上，橙篇可實現超長文本無損理解，支持用户一次性上傳100個多種格式、單個最大200MB的文件，並支持基於上傳內容進行快速總結、問答和創作。

6）Meta推出AI音頻水印工具，能鑑別AIGC音頻和真人音頻，已在GitHub開源

Meta創建了一個名為“AudioSeal”的新系統，可以在AI生成的音頻中嵌入名為“水印”的隱藏信號，旨在檢測網絡上的AI生成內容。該工具能識別出一小時播客中可能由AI生成的音頻片段。工具已在GitHub上開源供人下載，並能為AI生成的音頻添加水印。

7）AI設計工具Kittl：輸入文字提示即可生成圖標、剪貼畫等

Kittl是一款AI驅動的設計平台，利用先進算法和機器學習，用户可通過簡單文本提示創建高質量設計元素，無需複雜技能和軟件操作。提供矢量標誌圖標、令人驚歎的圖像和剪貼畫，高級文本編輯，魔法着色，即用型模板。用户可訪問插圖、字體、照片、圖標、紋理等無限內容，輕鬆拖放並自定義。

8）ChatGPT進化版Siri今年無緣上線！蘋果正打造史上超薄iPhone 17

蘋果AI將在今年晚些時候推出，預計將持續到2025年。據知情人士透露，蘋果正設計一款更輕薄的iPhone 17，計劃於2025年推出。令人期待的Siri與ChatGPT的整合，新功能如Siri在設備上查找內容、精準控制設備和APP等，也不會在9月份立即上線。

/ 03 / 投融資情報

1）Ilya官宣成立新公司SSI，首個產品將是安全的超級智能

前OpenAI首席科學官Ilya Sutskever週三宣佈，與曾在OpenAI的同事以及前蘋果人工智能部門負責人、Cue聯合創始人攜手，共同成立致力於開發安全超級智能技術的企業Safe Superintelligence（SSI）。Sutskever表示，SSI特別之處在於，它的第一個產品將是安全的超級智能，在此之前不會做其他事情。

2）Hinton官宣加盟AI初創公司：用AI探索新材料，ML大牛擔任聯創

圖靈獎得主、深度學習之父Geoffrey Hinton加入英國AI新材料公司CuspAI，擔任顧問，利用AI設計新型碳捕獲材料以解決氣候變化問題。此公司也與LeCun領導的Meta FAIR實驗室展開合作，並獲得了3000萬美元的種子輪融資。

3）法國在歐洲生成式AI資金處於領先，倫敦擁有三成GenAI初創數量

據風險投資公司Accel和Dealroom分析師分析了歐洲和以色列的221家初創公司，發現法國初創企業在生成式人工智能領域迄今已籌集29億美元，超過了歐洲任何國家和以色列。近期的融資包括Mistral AI（籌集了6.4億美元）、“H” （籌集了2.2億美元的種子輪）、Poolside（據報道正在籌集一輪大額融資）。此外，初創公司約27%在倫敦創建。

/ 04 / AI基礎設施

1）谷歌研究院獲CVPR2024最佳論文，商湯科技50篇論文入選

全球人工智能計算機視覺領域頂級國際會議CVPR正在美國舉辦，共有來自全球的2719篇論文被接收，錄用率為23.6%。共有2篇論文獲得最佳論文等獎項，團隊成員分別來自谷歌研究院、加州大學聖地亞哥分校、南加州大學、劍橋大學及布蘭迪斯大學。

商湯科技及聯合實驗室的50篇論文選，其中9篇被錄用為Oral、Highlight，論文研究成果重點聚焦於推動視覺語言基礎模型的提升及多模態技術，其中有多篇涉及自動駕駛、機器人等前沿方向。

2）Flash Diffusion適用於任何擴散模型，實現幾步圖像生成

Flash Diffusion方法為圖像生成技術帶來突破，它加速了預訓練擴散模型生成過程，表現出色且高效多才多藝。研究人員採用可調整的分佈和對抗目標等創新手段，提高預測模型定位和計算效率。該方法適應不同骨幹網絡，顯著減少採樣步驟同時保持高質量生成。

3）吳恩達團隊新作：多模態多樣本上下文學習，無需微調快速適應新任務

吳恩達團隊最新研究評估了多模態基礎模型在10個數據集的上下文學習表現，揭示了批量查詢可顯著降低每個示例的延遲和推理成本，同時實現性能提升。發現表明，利用大量示例可以快速適應新任務和新領域，無需傳統微調。

4）李開復談報考AI專業：AI專業很多工作也能被AI取代

零一萬物CEO李開復近日接受採訪，結合最近高考填報志願的熱點，他談到了“是否應該去報考人工智能相關專業”的問題，表示“適合的去做，不適合的不該去做”，實際上AI專業很多工作都可以被AI取代。李開復建議，學AI先學編程，其次，無論報考什麼專業，都要把大模型當作自己最好的夥伴。