在開源面前，OpenAI沒有護城河：今天，大模型的安卓時刻來了_風聞

知危-知危官方账号-07-19 21:21

2023-07-19

過去半年裏，OpenAI 正通過 GPT 驚豔所有人。

人們普遍認為 GPT 的誕生是新時代的 “ iPhone ” 時刻，它將像 iPhone 把人們帶往移動互聯網時代一樣，成為新的 AI 大模型時代的門鑰匙。

不過，移動互聯網的繁榮進程中，不只有 iPhone 的功績，還有安卓及其背後各大安卓陣營手機廠商的功績。

甚至，單從出貨量角度來看，安卓陣營對移動互聯網時代的貢獻似乎更大。

而現在，屬於 AI 大語言模型的 “ 安卓時刻 ”，要來了。

當地時間 7 月 18 日，北京時間的今日凌晨，Meta 發佈了最新一代的開源大模型 Llama 2。

根據 Meta 官網的公開數據，本次發佈的 Llama 2 模型系列共包括 70 億、130 億和 700 億三個參數的變體模型。

Llama 2 經過兩萬億個 tokens 的訓練，人工註釋數據超過 100 萬條。而相比於 Llama 1，Llama 2 的訓練數據增加了 40%，上下文長度也是前者的兩倍。

經過此次升級，根據 Meta 公開的論文顯示，雖然目前 Llama 2 在各項大模型測試中仍遜色於 GPT-3.5，但在與目前開源大模型的跑分對比中，已經有了屠榜一般的表現。

Llama 2 與 GPT、PaLM 的跑分對比

Llama 2 與其他開源大模型跑分對比

或許你一看到 Llama 2 遜色於 GPT-3.5 就會覺得嗤之以鼻，畢竟後者已經進化到 4.0 的版本了。

但，你要明白，安卓在剛推出的時候，也是非常拉胯的，而開源讓安卓陣營現在能與 iPhone 分庭抗禮。

所以，此次 Llama 2 發佈最大的亮點其實在於：

Meta 在開源基礎上更進一步，允許了該模型的免費商用。（月活大於 7 億的產品需要單獨申請商用權限，但很少有企業能達到這個標準）

圖靈獎得主，Meta 首席科學家楊立昆也在推特直言，這將改變大語言模型市場的格局：

知危編輯部也聯繫到了在學術圈和開源社區都頗具影響力的智源 AI 研究院，他們的評價是：

開源是必由之路，説 Llama 2 的發佈是“ 安卓時刻 ”也不無道理，用開源來佔領市場，就是一個競爭策略。

與 Llama 2 商用開源相對應的是，OpenAI 在開源面前的態度一直含糊不清。

開源，或者説是開放源碼運動，正式開始於上世紀的九十年代末，參與者們信仰軟件的開放源代碼、信息共享和自由使用。

Android 的興起、GitHub 的流行，都和開源脱不了關係。Linux 系統也誕生於這波運動中，如今的路由器、交換機、智能洗衣機、智能電飯煲、交換機、服務器等等設備上，幾乎搭載了各類 Linux 系統。

包括幾年前的美國火星車登陸成功，也象徵着火星成為第二個 Linux 計算機數量超過 Windows 的星球。

毫不誇張地説，如今開源改變了軟件的協作和創新模式，改變了技術格局。

但在大語言模型領域，領頭羊 OpenAI 卻似乎和名字裏的 Open 背道而馳。

即便 OpenAI 創始人山姆·奧特曼多次在公開場合提到，將在未來開放 GPT-3、GPT-4 的源碼，但這至今依舊是空頭支票。

包括馬斯克在退出 OpenAI 之後，也多次公開炮轟 OpenAI，不滿 OpenAI 大肆賺取利潤，並逐漸閉源。

OpenAI 首席科學家 Sutskever 對此的回應則是，過早開源會讓 OpenAI 失去技術領先的地位，並且大語言模型的威力巨大，開源恐有安全隱患。

馬斯克質疑 OpenAI 不 Open

不同於 OpenAI 在開源面前的畏畏縮縮，Meta 則是堅定的開源支持者，並且在一定程度上推動了 AI 的歷史進程。

而 Meta 今天的這一決策，和 Meta 的首席科學家楊立昆，勢必有着一定的關係。

早在 2014 年，扎克伯格就意識到了 AI 的前景，在 DeepMind 最終被谷歌收購之後，扎克伯格轉頭找到了 AI 學術領域的大佬楊立昆。

曾在大名鼎鼎的貝爾實驗室工作過的楊立昆，是 “ 卷積神經網絡 ” 的開發者之一，彼時的他正在紐約教書。

根據 VOX 的報道，為了得到楊立昆這匹千里馬，扎克伯格答應了科研成果必須開源、實驗室必須建在紐約、實驗團隊不需要考慮盈利等等要求。

楊立昆任職期間成果頗豐，諸如開發了風靡全球的 AI 框架 Pytorch，改進了 GAN（生成式對抗網絡），推出大語言模型 Llama 和 AI 圖像模型 SAM 等等。

正如當年所約定的那樣，這些項目已全部開源。

在大語言模型的浪潮之下，Llama 大語言模型也備受開源社區的歡迎。

諸如 Hugging Face 等開源社區中，充斥着各種被魔改後的羊駝（ Llama 的中文譯為羊駝）。

包括斯坦福的 Alpaca、UCB 的 Vicuna……各種基於 LlamA 的修改的模型紛紛湧現。

在不少的大模型跑分榜單上，GPT-3.5 和 GPT-4 之下，幾乎都是羊駝家族屠榜。

另外，對於 OpenAI 口中出於安全考慮的閉源理由，楊立昆也是不太認同的。

在他看來，使人工智能平台安全、良善、實用的唯一方法就是開源。

換句話説，技術掌握在少數人的手裏是危險的，只有讓監管 AI 的力量也同時進化，才能儘可能地管住 AI。

在目前看來，暫時只有開源能辦到。

總的來講，在 OpenAI 領銜的大語言模型浪潮中，Meta 所帶領的開源大軍，正在開源社區中瘋狂攻城掠地。

另一方面，開源和閉源之間的衝突也在逐漸白熱化。

在今年的五月份，一位谷歌研究人員 “ 不小心 ” 泄露的備忘錄，就把這場大戰擺在了枱面上。

知危編輯部簡單總結了一下這份備忘錄中，谷歌研究員的提到幾個要點：

①開源 AI 正在蠶食谷歌和 Open AI 的領地；

②小模型比大模型更具有競爭力；

③數據質量遠比數據數量更重要；

④谷歌打不過開源；

⑤相比於開源需要谷歌，谷歌更需要一個開源生態。

再簡短點講，這份洋洋灑灑上千字的文章就透露着一個最核心的信息：

在開源面前，谷歌和 OpenAI 都沒有護城河。

所以，再回看這次發佈的 Llama 2 ，Meta 直接把商業用途的限制給去掉了，實屬是又給閉源陣營將了一軍。

開源的 Llama2 不僅免費，還更能供開發者自行調整，從而滿足大部分商業公司的低成本和個性化需要。

但，最終開源和閉源誰才是勝者，知危編輯部覺得並不好下定論。

畢竟開源也並不是萬能解藥，開發人員良莠不齊、公開的一些安全隱患等等，都是開源經常遇到一些問題。

開源和閉源之爭，歸根結底是競爭策略不同，一個更注重擴大市場和制定標準，一個更看重盈利和本身技術的領先。

諸如安卓與 iOS、Linux 與 Windows，最後或許並無真正的輸贏之分，而是在不同的需求下，找到自己的合理定位。

但，毫無疑問，Llama 2 攪動了整個市場，已經讓生態開始有微妙的變化：

① OpenAI 股東之一的微軟，這次成了 Llama 2 的首選合作伙伴，微軟似乎正在兩頭押注。

② Meta 宣佈 Llama 2 將能在高通芯片上運行，這對 AI 芯片霸主英偉達而言勢必是種挑戰。

總之，這大語言模型圈兒的戲，是越來越複雜，越來越有趣了。

如果因為 Llama 2 攪的這場渾水，讓 AI 時代能更快來臨的話，請大家記得，這不僅是 Meta 的功勞，也是開源社區的功勞：

開源推動進步，開源萬歲~