IT崗位天塌了！Claude 4震撼發佈：AI編程大模型再進化_風聞

歪睿老哥-芯片研发工程师-聚焦芯片行业的那些事，唯武侠与芯片不可辜负1小时前

2025-05-26

電子發燒友網報道（文 / 吳子鵬）5 月 23 日凌晨，著名大模型平台 Anthropic 召開首屆開發者大會，重磅發佈最新大模型 ——Claude 4。Claude 4 包含兩個版本，即 Claude Opus 4 和 Claude Sonnet 4。這兩個模型旨在更好地遵循指令，在編寫代碼、解答覆雜問題等任務中，能夠更自主地運行。其中，Opus 4 堪稱全球頂級編程模型，尤其擅長處理複雜且長時間的推理任務，在 Agent 領域表現卓越。

據日本 Rakuten 測試數據顯示，基於 Opus 4 打造的編程智能體，可獨立穩定連續工作 7 小時，一舉超越此前 OpenAI 創造的記錄。Sonnet 4 作為 Sonnet 3.7 的迭代版本，在編程領域同樣實力強勁，在 SWE-bench 測試中得分達到 72.7%，超過了 OpenAI 最新發布的 Codex-1、o3 等前沿模型。

儘管 Anthropic 聲稱，AI 模型 Claude 4 是用於實現日常工作自動化的工具，並非旨在取代工作崗位。然而，這些模型展現出的強大能力，確實可能給 IT 人員羣體帶來結構性影響，從事重複性編程任務的 IT 人員或將逐步面臨淘汰。

編程大模型能力持續進階

SphericalInsights 的預測數據顯示，到 2032 年，全球 AI 編碼工具市場規模將突破 295 億美元。當前，全球 AI 編程大模型的技術水平不斷提升。國際上，OpenAI GPT-4o-latest、Anthropic 此前發佈的 Claude 3.5 Sonnet、Google Gemini Flash 2.0 和 Meta Llama 3.3 等大模型頗具實力；國內方面，字節跳動的 MarsCode 和 Trae、科大訊飛的 iFlyCode 等大模型也不容小覷。

在 Claude 4 發佈前，OpenAI GPT-4o-latest 是全球影響力較大的編程大模型。在 SWE-bench 測試中，它取得了 72.5% 的得分，擅長複雜算法設計與數學建模，支持 Python、C++ 等多種語言的代碼生成，能夠處理數百萬行級的代碼庫。根據 2025 年 1 月發佈的 SuperCLUE 大模型排行榜，OpenAI 的 o1 模型以總分 80.4 領跑，在高難度任務（Hard 評分 76.7）和理科能力（87.3 分）方面表現出色，但在代碼補全的個性化適配性上存在一定不足。此外，OpenAI 的 o3 模型是在 o1 和 o1-ioi 基礎上的進一步升級，它擺脱了對人工設計測試時策略的依賴，通過強化學習自主開發並執行復雜的推理策略，在 CodeForces 和 IOI 2024 中的表現，充分證明了其在解決複雜編程任務上的卓越能力。

國內較具代表性的是字節跳動的 MarsCode 和 Trae。MarsCode 於 2024 年 6 月發佈，是基於豆包大模型打造的智能開發工具，涵蓋編程助手和 Cloud IDE 兩種主要形態，具備項目問答、代碼補全、單測生成、Bug Fix 等功能。據悉，MarsCode 支持超過 100 種編程語言，可與 VSCode 和 JetBrains 代碼編輯器兼容。2025 年 1 月，字節跳動在 MarsCode 基礎上新增 AI 編程功能，並推出海外版 Trae。Trae 是一個獨立的 AI 原生開發平台，提供從需求到代碼的全鏈路智能開發環境。

此前，Claude 3.5 Sonnet 在行業內就頗具名氣。該模型發佈時分享的 HumanEval 測試顯示，Claude 3.5 Sonnet 以 92.0% 的得分超越包括 GPT-4o 在內的眾多競爭對手。而 Claude 4 的問世，進一步鞏固了 Anthropic 在 AI 編程領域的技術領先地位。Anthropic 首席科學官 Jared Kaplan 表示，公司自去年年底起，決定不再繼續投入資源開發聊天機器人，轉而專注提升 Claude 執行復雜任務的能力，如開展研究、進行編程，甚至編寫整個代碼庫。

Anthropic 將 Claude Opus 4 譽為 “公司迄今最強大的模型，也是全球最佳編程模型”。Opus 4 和 Sonnet 4 均採用混合模式設計，既能實現幾乎即時回應，也可進行深入的推理思考，即擴張思維。除了在 SWE-bench Verified 測試中的優異評分，以及 Rakuten 測試中連續穩定運行 7 小時的出色表現，Opus 4 還在記憶與工具使用方面帶來革新：當獲取本地文件訪問權限時，它可創建並維護內存文件以存儲關鍵信息；“即時響應” 和 “擴展思考” 雙模式，使其在處理複雜任務時，能夠暫停推理調用工具，並行處理多個工具請求，模擬人類邊思考邊驗證的認知過程。此外，Opus 4 深度嵌入開發者工具鏈，可通過 GitHub Actions 執行後台任務，並與 VS Code、JetBrains IDE 實現原生集成。

與目前行業頂尖的 AI 編程模型工具相比，Claude Opus 4 優勢顯著。例如，在 SWE-bench 和 Terminal-bench 測試中，Opus 4 的得分領先頂尖對手超 17%，在處理數百萬行級代碼庫時，其上下文窗口和連續編程能力更是遠超競品；與谷歌公司目前最強的 Gemini 2.5 Pro 相比，儘管後者在多模態理解方面佔優，但在複雜代碼重構場景中，仍不及 Opus 4。

由此可見，Claude Opus 4 的發佈，標誌着 AI 編程助手從輔助工具向核心開發者的重大轉變。其 7 小時連續編程能力、動態記憶管理和混合推理模式，不僅重新定義了軟件開發的效率邊界，更促使開發者從單純的代碼生產者，向 AI 協作架構師轉型。

讓 AI 成為助力而非威脅

據裁員追蹤機構 Layoffs.fyi 的數據，截至 2024 年 12 月 2 日，全球科技公司在這一年至少裁員 14.9 萬人。這一數字明顯高於 2022 年和 2023 年同期，凸顯出科技行業在 AI 浪潮下所面臨的巨大變革壓力。儘管各大推出 AI 大模型的公司一再強調，AI 並非要取代人類員工，但 AI 帶來的降本增效，確實是許多公司裁員的因素之一。

Claude Opus 4 等 AI 大模型無疑將加速 IT 行業的變革進程，推動軟件開發和軟件定製走向民主化。Anthropic 首席執行官 Dario Amodei 大膽預測，到 2026 年，首家由一名人類員工與 AI 合作運營、估值達十億美元的企業將誕生。

綜合 Claude Opus 4 等 AI 大模型所具備的能力來看，一個明確的趨勢是：基礎的 CRUD 開發需求大幅減少。這一趨勢已有數據佐證，美國勞工統計局數據顯示，2025 - 2030 年，“初級軟件工程師” 崗位需求將下降 15%；同時，美國 2 月 IT 失業率上升近 0.5 個百分點，達到 3.3%，創下 2024 年 8 月以來的新高。

那麼，IT 人員該如何順應這股 AI 浪潮，避免被 AI 技術取代呢？行業內已形成普遍共識，IT 人員可通過以下路徑實現職業進階：首先，從 “代碼生產者” 轉型為 “AI 引導者”。如今，傳統的寫代碼能力已不再是核心競爭力，掌握 AI 模型微調、提示工程的 IT 崗位薪資水平正逐步上漲，調查數據顯示，國內相關崗位薪資已上浮 28%。

對於初入職場的 IT 人員，還可選擇成為 AI 大模型開發者。該崗位基本要求掌握 Python、PyTorch/TensorFlow 框架，熟悉 NLP、CV 等技術，具備模型微調與二次訓練能力，瞭解 LangChain、LoRA 等大模型開發工具。此外，IT 人員也可朝着 AI 大模型應用方向發展，大模型與具體場景的融合已成趨勢，如電商虛擬試衣、物流智能問答系統等相關崗位，薪資上浮幅度在 10% - 20%。

除了上述基礎型發展方向，IT 人員還可向全棧工程師、AI 架構師等複合型高階崗位進階。目前，這類崗位需求增長 58%，薪資溢價達 50%。

寫在最後

Claude Opus 4 的發佈，標誌着 IT 行業正從人力密集型向 AI 增強型轉型。儘管這一變革會帶來衝擊，但也藴含着巨大機遇：AI 取代的是重複性勞動，而人類的價值將向創造性、戰略性工作轉移。IT 人員需以 “技術深度 + AI 協作 + 行業洞察” 構建核心競爭力，通過技能升級、職業轉型和終身學習，實現從 “代碼生產者” 到 “AI 時代架構師” 的跨越。

聲明：本文由電子發燒友原創