IT崗位天塌了!Claude 4震撼發佈:AI編程大模型再進化_風聞
歪睿老哥-芯片研发工程师-聚焦芯片行业的那些事,唯武侠与芯片不可辜负1小时前
電子發燒友網報道(文 / 吳子鵬)5 月 23 日凌晨,著名大模型平台 Anthropic 召開首屆開發者大會,重磅發佈最新大模型 ——Claude 4。Claude 4 包含兩個版本,即 Claude Opus 4 和 Claude Sonnet 4。這兩個模型旨在更好地遵循指令,在編寫代碼、解答覆雜問題等任務中,能夠更自主地運行。其中,Opus 4 堪稱全球頂級編程模型,尤其擅長處理複雜且長時間的推理任務,在 Agent 領域表現卓越。
據日本 Rakuten 測試數據顯示,基於 Opus 4 打造的編程智能體,可獨立穩定連續工作 7 小時,一舉超越此前 OpenAI 創造的記錄。Sonnet 4 作為 Sonnet 3.7 的迭代版本,在編程領域同樣實力強勁,在 SWE-bench 測試中得分達到 72.7%,超過了 OpenAI 最新發布的 Codex-1、o3 等前沿模型。
儘管 Anthropic 聲稱,AI 模型 Claude 4 是用於實現日常工作自動化的工具,並非旨在取代工作崗位。然而,這些模型展現出的強大能力,確實可能給 IT 人員羣體帶來結構性影響,從事重複性編程任務的 IT 人員或將逐步面臨淘汰。
編程大模型能力持續進階
SphericalInsights 的預測數據顯示,到 2032 年,全球 AI 編碼工具市場規模將突破 295 億美元。當前,全球 AI 編程大模型的技術水平不斷提升。國際上,OpenAI GPT-4o-latest、Anthropic 此前發佈的 Claude 3.5 Sonnet、Google Gemini Flash 2.0 和 Meta Llama 3.3 等大模型頗具實力;國內方面,字節跳動的 MarsCode 和 Trae、科大訊飛的 iFlyCode 等大模型也不容小覷。
在 Claude 4 發佈前,OpenAI GPT-4o-latest 是全球影響力較大的編程大模型。在 SWE-bench 測試中,它取得了 72.5% 的得分,擅長複雜算法設計與數學建模,支持 Python、C++ 等多種語言的代碼生成,能夠處理數百萬行級的代碼庫。根據 2025 年 1 月發佈的 SuperCLUE 大模型排行榜,OpenAI 的 o1 模型以總分 80.4 領跑,在高難度任務(Hard 評分 76.7)和理科能力(87.3 分)方面表現出色,但在代碼補全的個性化適配性上存在一定不足。此外,OpenAI 的 o3 模型是在 o1 和 o1-ioi 基礎上的進一步升級,它擺脱了對人工設計測試時策略的依賴,通過強化學習自主開發並執行復雜的推理策略,在 CodeForces 和 IOI 2024 中的表現,充分證明了其在解決複雜編程任務上的卓越能力。
國內較具代表性的是字節跳動的 MarsCode 和 Trae。MarsCode 於 2024 年 6 月發佈,是基於豆包大模型打造的智能開發工具,涵蓋編程助手和 Cloud IDE 兩種主要形態,具備項目問答、代碼補全、單測生成、Bug Fix 等功能。據悉,MarsCode 支持超過 100 種編程語言,可與 VSCode 和 JetBrains 代碼編輯器兼容。2025 年 1 月,字節跳動在 MarsCode 基礎上新增 AI 編程功能,並推出海外版 Trae。Trae 是一個獨立的 AI 原生開發平台,提供從需求到代碼的全鏈路智能開發環境。
此前,Claude 3.5 Sonnet 在行業內就頗具名氣。該模型發佈時分享的 HumanEval 測試顯示,Claude 3.5 Sonnet 以 92.0% 的得分超越包括 GPT-4o 在內的眾多競爭對手。而 Claude 4 的問世,進一步鞏固了 Anthropic 在 AI 編程領域的技術領先地位。Anthropic 首席科學官 Jared Kaplan 表示,公司自去年年底起,決定不再繼續投入資源開發聊天機器人,轉而專注提升 Claude 執行復雜任務的能力,如開展研究、進行編程,甚至編寫整個代碼庫。
Anthropic 將 Claude Opus 4 譽為 “公司迄今最強大的模型,也是全球最佳編程模型”。Opus 4 和 Sonnet 4 均採用混合模式設計,既能實現幾乎即時回應,也可進行深入的推理思考,即擴張思維。除了在 SWE-bench Verified 測試中的優異評分,以及 Rakuten 測試中連續穩定運行 7 小時的出色表現,Opus 4 還在記憶與工具使用方面帶來革新:當獲取本地文件訪問權限時,它可創建並維護內存文件以存儲關鍵信息;“即時響應” 和 “擴展思考” 雙模式,使其在處理複雜任務時,能夠暫停推理調用工具,並行處理多個工具請求,模擬人類邊思考邊驗證的認知過程。此外,Opus 4 深度嵌入開發者工具鏈,可通過 GitHub Actions 執行後台任務,並與 VS Code、JetBrains IDE 實現原生集成。
與目前行業頂尖的 AI 編程模型工具相比,Claude Opus 4 優勢顯著。例如,在 SWE-bench 和 Terminal-bench 測試中,Opus 4 的得分領先頂尖對手超 17%,在處理數百萬行級代碼庫時,其上下文窗口和連續編程能力更是遠超競品;與谷歌公司目前最強的 Gemini 2.5 Pro 相比,儘管後者在多模態理解方面佔優,但在複雜代碼重構場景中,仍不及 Opus 4。
由此可見,Claude Opus 4 的發佈,標誌着 AI 編程助手從輔助工具向核心開發者的重大轉變。其 7 小時連續編程能力、動態記憶管理和混合推理模式,不僅重新定義了軟件開發的效率邊界,更促使開發者從單純的代碼生產者,向 AI 協作架構師轉型。
讓 AI 成為助力而非威脅
據裁員追蹤機構 Layoffs.fyi 的數據,截至 2024 年 12 月 2 日,全球科技公司在這一年至少裁員 14.9 萬人。這一數字明顯高於 2022 年和 2023 年同期,凸顯出科技行業在 AI 浪潮下所面臨的巨大變革壓力。儘管各大推出 AI 大模型的公司一再強調,AI 並非要取代人類員工,但 AI 帶來的降本增效,確實是許多公司裁員的因素之一。
Claude Opus 4 等 AI 大模型無疑將加速 IT 行業的變革進程,推動軟件開發和軟件定製走向民主化。Anthropic 首席執行官 Dario Amodei 大膽預測,到 2026 年,首家由一名人類員工與 AI 合作運營、估值達十億美元的企業將誕生。
綜合 Claude Opus 4 等 AI 大模型所具備的能力來看,一個明確的趨勢是:基礎的 CRUD 開發需求大幅減少。這一趨勢已有數據佐證,美國勞工統計局數據顯示,2025 - 2030 年,“初級軟件工程師” 崗位需求將下降 15%;同時,美國 2 月 IT 失業率上升近 0.5 個百分點,達到 3.3%,創下 2024 年 8 月以來的新高。
那麼,IT 人員該如何順應這股 AI 浪潮,避免被 AI 技術取代呢?行業內已形成普遍共識,IT 人員可通過以下路徑實現職業進階:首先,從 “代碼生產者” 轉型為 “AI 引導者”。如今,傳統的寫代碼能力已不再是核心競爭力,掌握 AI 模型微調、提示工程的 IT 崗位薪資水平正逐步上漲,調查數據顯示,國內相關崗位薪資已上浮 28%。
對於初入職場的 IT 人員,還可選擇成為 AI 大模型開發者。該崗位基本要求掌握 Python、PyTorch/TensorFlow 框架,熟悉 NLP、CV 等技術,具備模型微調與二次訓練能力,瞭解 LangChain、LoRA 等大模型開發工具。此外,IT 人員也可朝着 AI 大模型應用方向發展,大模型與具體場景的融合已成趨勢,如電商虛擬試衣、物流智能問答系統等相關崗位,薪資上浮幅度在 10% - 20%。
除了上述基礎型發展方向,IT 人員還可向全棧工程師、AI 架構師等複合型高階崗位進階。目前,這類崗位需求增長 58%,薪資溢價達 50%。
寫在最後
Claude Opus 4 的發佈,標誌着 IT 行業正從人力密集型向 AI 增強型轉型。儘管這一變革會帶來衝擊,但也藴含着巨大機遇:AI 取代的是重複性勞動,而人類的價值將向創造性、戰略性工作轉移。IT 人員需以 “技術深度 + AI 協作 + 行業洞察” 構建核心競爭力,通過技能升級、職業轉型和終身學習,實現從 “代碼生產者” 到 “AI 時代架構師” 的跨越。

聲明:本文由電子發燒友原創