高通宣佈：OpenAI 最小開源模型 gpt-oss-20b 可在驍龍終端運行

2025-08-12

【環球網科技綜合報道】8月12日消息，OpenAI近日推出其最小開源模型gpt-oss-20b，該模型在常見基準測試中表現與OpenAI o3mini模型相近。今日，高通公司宣佈，這是OpenAI首個可在搭載驍龍平台的終端側運行的開源推理模型。

據瞭解，高通表示gpt-oss-20b思維鏈推理模型能夠直接在搭載驍龍旗艦處理器的終端上運行。此前，OpenAI的複雜模型僅能在雲端部署，而此次是OpenAI首次實現模型對終端側推理的支持。高通通過提前獲取該模型，並結合高通®AI引擎和Qualcomm®AI Stack進行集成測試，發現這款擁有200億參數的模型表現優異，可完全在終端側完成思維鏈推理。

高通認為，這一突破是一個關鍵轉折點，它預示着AI的未來發展方向——豐富複雜的助手式推理將在本地實現。這也體現了AI生態系統的成熟，合作伙伴和開發者可藉助驍龍處理器，及時運用OpenAI等領軍企業的開源創新成果。OpenAI的gpt-oss-20b模型將助力終端設備利用終端側推理，在隱私保護和時延方面凸顯優勢，同時通過AI智能體為雲端解決方案提供支持。

高通介紹，在提前獲取gpt-oss-20b模型後，結合Qualcomm AI Stack開展集成測試，充分驗證了該模型的卓越能力，其能夠在終端側完成複雜推理。開發者可通過Hugging Face和Ollama等主流平台獲取該模型，並在搭載驍龍平台的終端上發揮其性能。有關該模型的更多部署詳情，即將在Qualcomm AI Hub上公佈。

值得一提的是，將Ollama的輕量級開源LLM服務框架與強大的驍龍平台相集成，開發者和企業不僅能直接在搭載驍龍計算平台的終端上運行gpt-oss-20b模型，還可實現網頁搜索等多項默認功能，無需額外配置。用户也能在Ollama上嘗試Turbo模式，進一步探索該模型的更多功能。（純鈞）