台灣建立自己的AI語言模型“Taide”以對抗中國的科技影響-彭博社
Jennifer Creery
當被問及誰贏得了最近的台灣總統選舉時,世界上最先進的中文聊天機器人給出了令人困惑的答案。
“賴清德,”百度公司的Ernie Bot準確地説道。但隨後它補充道:“無論台灣的局勢如何變化,基本事實是隻有一箇中國” — 這一評論回應了美國友好候選人贏得了成為中國希望有朝一日統治的島國下一任總統的競選後,北京外交官所説的話。
對於本應是直截了當的問題和答案出現政治傾向,這對台灣來説是一個問題,台灣官員擔心來自中國的有影響力的科技平台,如抖音和小紅書,正在侵蝕該島國的文化和政治基礎。
為了減輕中國日益增長的科技影響力並在新興人工智能生態系統中建立立足點,台灣通過2026年預算了約174億新台幣(約合55.56億美元)來發展行業專業知識和工具。此外,它還在可信人工智能對話引擎(Taide)上投入了約740萬美元,該語言模型的開發者表示,它將為企業、銀行、醫院和政府辦公室提供寫郵件和會議總結等任務的平台。希望這一工具能擺脱中國的政治影響。
李育傑,國立交通大學應用數學教授,泰德項目協調人,表示台灣需要“一個與我們價值觀一致的大型語言模型。”“一個大型語言模型嵌入了一個地方的知識體系,更重要的是,它的核心價值觀:自由、民主、人權,”他説。
參見: 抖音網紅為習近平在台灣贏得罕見軟實力
這個自詡為“硅島”的地方已經在人工智能發展中扮演着關鍵角色,因為它最大的公司,台灣積體電路製造股份有限公司,生產最受追捧的加速器芯片。根據台積電首席執行官魏哲家的説法,它是Nvidia Corp.的首選人工智能芯片製造商,也是整個人工智能創新浪潮的“推動者”。推動國內語言模型和相關軟件和工程生態系統的發展旨在將台灣推向更高的發展鏈。
為了實現這一目標,泰德的開發人員正在從當地媒體和政府機構獲取許可內容。然後將這些材料添加到Llama 2,Meta Platforms Inc的開源大型語言模型上。這種方法的一個好處是內容將採用島上2300萬人使用的繁體中文,而不是中國所使用的簡化版本。泰德的早期版本預計將於今年4月推出,供選擇合作伙伴進行測試。
Taide 在範圍上有限,與 ChapGPT 等產品相比——而其資金與 Meta 和 Microsoft Corp. 等公司投入的數十億美元相比顯得微不足道——但開發者們希望該工具和其他本地開發的人工智能計劃的其他方面,有朝一日能夠使台灣在軟件行業發揮更大的作用。
雖然 ChatGPT 確實有中文選項,但對台灣的需求來説並不理想。一個關鍵原因是政府和公司不希望將私人數據放入 OpenAI 平台。
去年,三星電子公司員工將敏感代碼上傳到該平台後,對數據安全和人工智能的擔憂被強調。這也是台灣華碩計算機公司計劃推出一個人工智能計算平台的主要原因,該平台將在客户設施中安裝所有硬件。
Taide 的開發者們還表示,他們的最終產品將允許安全處理和存儲敏感的銀行、醫療和官方信息,尤其是因為這些信息將存儲在台灣的服務器上。
| 閲讀更多: |
|---|
| * 台灣選出親美總統,蔑視中國的警告 * 獨立將意味着戰爭,中國警告台灣領先者 * 監管人工智能?美國、歐盟和中國的做法:簡介 * 華碩將出售 Nvidia 人工智能服務器,您可以在辦公室安裝 |
台灣的模式不必與ChatGPT等領導者的實力相匹配才能有效,它的建造者們説。“要把整個行業提升到一個新水平,足夠好就足夠了,”國立台灣大學計算機科學教授、台北玉山銀行首席技術官Jyh-shing Jang説。Jyh-shing Jang,他還擔任台北玉山銀行的首席技術官。
“公司可以將Taide用作原型,然後嘗試微調模型並提煉,直到足夠小以至於可以放入您的筆記本電腦或手機中,”Jang説,他對該項目很熟悉,因為該銀行已同意向其提供非個人數據。
對AI項目的聚焦標誌着台灣的轉變,台灣科技產業主要由台積電等硬件製造商主導。雖然該島嶼的公司深度參與AI產業,但幾乎完全是從硬件角度出發。
“我能理解這是如何產生的,即‘嘿,我們沒有百度、華為、OpenAI或谷歌的等價物,所以我們需要通過嘗試在系統內部工作來提前做到這一點,以免被其他模型淹沒,”Albright Stonebridge Group的技術政策負責人Paul Triolo説。
“但這並不是一場輕鬆的遊戲,”他説。“着手進行這項工作將需要大量持續的努力和資源。”