阿里雲開源代碼模型Qwen2.5-Coder 可適配多應用場景
【環球網科技報道 記者 勃潺】11月12日,阿里雲通義大模型團隊宣佈開源通義千問代碼模型全系列,共6款Qwen2.5-Coder模型。基於Qwen2.5-Coder,AI編程性能和效率均實現大幅提升,編程“小白”也可輕鬆生成網站、數據圖表、簡歷、遊戲等各類應用。

編程語言是高度邏輯化和結構化的,代碼模型要求理解、生成和處理這些複雜的邏輯關係和結構,通常也被認為是大模型邏輯能力的基礎來源之一,對於整體提升大模型推理能力至關重要。Qwen2.5-Coder基於Qwen2.5基礎大模型進行初始化,使用源代碼、文本代碼混合數據、合成數據等5.5T tokens的數據持續訓練,實現了代碼生成、代碼推理、代碼修復等核心任務性能的顯著提升。
此次開源,Qwen2.5-Coder推出0.5B/1.5B/3B/7B/14B/32B 等6個尺寸的全系列模型,每個尺寸都開源了Base 和 Instruct 模型,其中,Base模型可供開發者微調,Instruct模型則是開箱即用的官方對齊模型。
Qwen2.5-Coder全系列開源,可適配更多應用場景,無論在端側還是雲上,都可以讓AI大模型更好地協助開發者完成編程開發,即便是編程“小白”,也可基於內置Qwen2.5-Coder的代碼助手和可視化工具,用自然語言對話生成網站、數據圖表、簡歷和遊戲等各類應用。
截至目前,Qwen2.5已開源100多個大語言模型、多模態模型、數學模型和代碼模型,幾乎所有模型都實現了同等尺寸下的最佳性能。據瞭解,全球基於Qwen系列二次開發的衍生模型數量9月底突破7.43萬,超越Llama系列衍生模型的7.28萬。