高通宣佈:OpenAI 最小開源模型 gpt-oss-20b 可在驍龍終端運行
【環球網科技綜合報道】8月12日消息,OpenAI近日推出其最小開源模型gpt-oss-20b,該模型在常見基準測試中表現與OpenAI o3mini模型相近。今日,高通公司宣佈,這是OpenAI首個可在搭載驍龍平台的終端側運行的開源推理模型。
據瞭解,高通表示gpt-oss-20b思維鏈推理模型能夠直接在搭載驍龍旗艦處理器的終端上運行。此前,OpenAI的複雜模型僅能在雲端部署,而此次是OpenAI首次實現模型對終端側推理的支持。高通通過提前獲取該模型,並結合高通®AI引擎和Qualcomm®AI Stack進行集成測試,發現這款擁有200億參數的模型表現優異,可完全在終端側完成思維鏈推理。

高通認為,這一突破是一個關鍵轉折點,它預示着AI的未來發展方向——豐富複雜的助手式推理將在本地實現。這也體現了AI生態系統的成熟,合作伙伴和開發者可藉助驍龍處理器,及時運用OpenAI等領軍企業的開源創新成果。OpenAI的gpt-oss-20b模型將助力終端設備利用終端側推理,在隱私保護和時延方面凸顯優勢,同時通過AI智能體為雲端解決方案提供支持。
高通介紹,在提前獲取gpt-oss-20b模型後,結合Qualcomm AI Stack開展集成測試,充分驗證了該模型的卓越能力,其能夠在終端側完成複雜推理。開發者可通過Hugging Face和Ollama等主流平台獲取該模型,並在搭載驍龍平台的終端上發揮其性能。有關該模型的更多部署詳情,即將在Qualcomm AI Hub上公佈。
值得一提的是,將Ollama的輕量級開源LLM服務框架與強大的驍龍平台相集成,開發者和企業不僅能直接在搭載驍龍計算平台的終端上運行gpt-oss-20b模型,還可實現網頁搜索等多項默認功能,無需額外配置。用户也能在Ollama上嘗試Turbo模式,進一步探索該模型的更多功能。(純鈞)