近期,中國人工智能初創企業——深度求索公司(DeepSeek)憑借其開源大模型R1及前代V3,成為撬動全球科技版圖的一把“新杠桿”。與硅谷“燒錢堆算力”不同,DeepSeek通過算法革命將模型訓練成本降低了約60%,僅以557.6萬美元的純算力投入實現了性能對標GPT-4o的成績,并以開源策略吸引全球開發者目光。業內人士普遍認為,“低成本、高精度”正在沖擊著以美歐企業為中心的AI敘事與競爭規則。
在這一背景下,從華爾街資本市場劇烈震蕩,到微軟、華為等巨頭火速適配DeepSeek的產品,“DeepSeek現象”早已不僅是一場新興技術突圍的故事,更成為國際科技競爭格局重塑的觀察窗口。它正向人們提出了新的問題——當中國AI企業以算法創新突圍,全球AI賽道是否將迎來全新的規則重估?
嶄露頭角:
性能卓越,用戶體驗佳
“起初以為又是炒作概念的AI產品,現在想想還是不可思議?!蹦晨萍脊緮祿治鰩煾咛煊钕蛑袊鞘袌笥浾哒故舅謾C端的DeepSeek應用界面時,依然難掩驚喜。作為一名95后科技愛好者,他在兩個月前偶然試用DeepSeek,原本想做一次簡單的新能源汽車市場分析,沒想到一段關于近五年政策變化的深度解析瞬間改變了他的看法。
“當時要準備行業報告,就隨口讓DeepSeek梳理近五年新能源汽車相關的中央及地方政策?!备咛煊罨貞浀?,“它先列出12項關鍵政策,然后結合動態數據模型,逐層推演對產業鏈的影響,最終還得出了‘2025年電池技術迭代窗口期’的觀點。這個系統層層遞進的邏輯讓人眼前一亮,就像有個專家團隊在幫我拆解問題,很多視角比專業咨詢報告還透徹。”
現在,小高的工作界面里常駐兩個窗口——Excel和DeepSeek。他告訴中國城市報記者,平時撰寫材料會用DeepSeek來核對數據口徑,處理客戶需求時則讓它生成備選方案,甚至做PPT也會先讓AI搭好框架。“上周有個項目需要處理200份問卷的數據,它用交叉分析法三分鐘就找出了潛在矛盾點,以往得折騰半天?!彼蜷_工作日志,指著最近三個月的效率曲線,“項目交付效率整整提升了40%?!?/p>
更讓小高意外的是,這個“智能助手”無形中還拓寬了他的知識面?!扒疤旆治鲩L三角產業轉移,它又列舉德國魯爾區轉型案例,提醒我關注技術工人流動數據?,F在遇到復雜問題不先問問DeepSeek,總覺得缺了道‘保險栓’。”說著,他又習慣性地點開DeepSeek,“這滿屏的行業術語和本土數據,優勢可不只是技術參數能體現的。咱們的‘東方力量’,真不比ChatGPT差!”
DeepSeek是啥
DeepSeek背后的核心研發力量,最初源自幻方量化在GPU訓練量化交易模型方面的經驗。幻方量化是國內率先囤積過萬塊高端GPU用于大模型研發的企業之一,GPU儲備規模甚至比肩國內一線互聯網公司,遠超國內主流大模型創業團隊。
DeepSeek在海外“出圈”,始于2024年12月的一系列重量級發布。當月,公司推出了開源模型DeepSeek-V3,測試顯示該模型在多項評測中優于主流開源方案,并且在保持高水準的同時具備明顯的成本優勢。其能力可與閉源的GPT-4o相近,但訓練只用了2048張英偉達H800 AI芯片,純算力成本僅為557.6萬美元,比Meta發布的Llama-3-405B的一個訓練周期還低了一個數量級。
時間進入2025年1月,DeepSeek發布了對標OpenAI最新推理模型o1的DeepSeek-R1,號稱在數學、代碼、自然語言推理等任務上實現了新的“自發涌現”式推理能力,并將其免費開源。與此形成鮮明對比的是,OpenAI、英偉達等巨頭正醞釀大規模算力基建計劃,涉及高達5000億美元的投資。這樣一來,DeepSeek的“純算法”打法令全球行業目光紛紛聚焦。
北京郵電大學人工智能學院人機交互與認知工程實驗室主任劉偉向中國城市報記者表示,DeepSeek的關鍵在于算法層面的突破和優化,大幅節省了算力與數據需求?!叭绻fOpenAI是‘大力出奇跡’,DeepSeek則證明‘小力也能出奇跡’?!痹诋a業普遍受到算力和資源限制的當下,這種思路無疑展現出可觀的競爭力。
市場反應:
美國科技股估值回調,
源于對算力霸權的質疑
DeepSeek系列模型推出后,如同在市場上投下一枚“震撼彈”,直接導致以英偉達為代表的美國科技股出現大幅波動。相比之下,國內AI產業界對DeepSeek訓練成本低的消息并不感到意外。
一位頭部大模型公司技術負責人向中國城市報記者分析:“557.6萬美元只是單次訓練純算力成本;如果要加上預實驗、數據清洗等流程,實際成本肯定要翻倍。但無論如何,相比國外閉源大模型,它依舊保持了極強的成本控制力。而且隨著時間推移,后來者總比先驅更具成本優勢,尤其在算法和數據管理上會更為成熟?!?/p>
《大西洋月刊》CEO湯普森表示,中國的開源模型在使用相對較少數據進行訓練的情況下,也能產出與OpenAI或Claude相當的效果,這對于減少能耗、提高效率具有重要意義。
事實上,國內大模型創業公司普遍在算力、資金方面面臨嚴峻限制,因而更傾向在軟件、算法和工程優化層面尋找突破。DeepSeek獨辟蹊徑,通過更高效的計算拓撲和模型結構設計,在保持相近性能的情況下,把算力成本砍掉近60%?!皠e人用100元訓練,DeepSeek用40元就能搞定,很多投資人一下子看到了大模型企業的新思路?!币晃粯I內資深分析師評價道,“這不只是技術路線的博弈,更重要的是為打破硅谷——華爾街聯合主導的AI敘事,打開了一條新通道。”
DeepSeek的問世被外界比喻為神秘的東方力量?!霸跇O其有限的資源條件下,通過算法層面的精心設計反超對手,展現了中國工程師文化與成本意識的雙重優勢?!痹摲治鰩熗瑫r指出,DeepSeek的成功為業界提供了一個關鍵啟示:在基礎硬件和數據資源都有限的前提下,如何通過算法和工程能力實現質的飛躍,是未來AI大模型產業亟待解決的核心命題。
硅谷巨頭的技術路徑被挑戰
Meta內部一位工程師在公司員工社區中直言:“DeepSeek極低的訓練成本,讓管理層開始擔憂此前投入數百億美元進行生成式AI研發的必要性?!碑敗盁X堆算力”不再是唯一可行道路,新創企業與巨頭之間的鴻溝便不再涇渭分明。深層次來看,DeepSeek以“省錢省力”的方式取得媲美GPT-4o、o1的模型表現,其背后是一場工程實用主義對技術理想主義的沖擊。
在OpenAI、甲骨文、英偉達等聯合宣布啟動高達5000億美元算力基建計劃的節骨眼上,DeepSeek卻用不到六成成本訓練出同等規模和精度的大模型,不僅為“重資產”的美國AI生態敲響了警鐘,更令他們對硬件與資金堆積模式的前景產生疑慮。國內一家大型科技公司的AI研究負責人接受采訪時表示:“當工程優化帶來的邊際收益遠高于單純加芯片的線性增長,硅谷多年來賴以維系的技術優勢就需要重新評估?!?/p>
換言之,DeepSeek的出現也挑戰了美國AI巨頭在資本與市場層面的敘事框架。對于真正需要盈利和長期發展的企業而言,控制成本、提高效率、獲得更高社會接受度才是硬道理。
“我們當然為這一突破感到自豪,但也要保持清醒。”該國內大型科技公司負責人稱,“不是每一家企業都能像OpenAI或xAI一樣,一輪就融到幾十億美元。DeepSeek的路線具有極強的實用價值,對那些資金鏈并不充裕的AI企業而言,這無疑是一種更現實的突圍方式。”
跨國科技企業爭相適配 搶灘DeepSeek生態
當華爾街與硅谷仍在激辯DeepSeek的沖擊時,國際科技巨頭們已率先行動,與DeepSeek-R1模型實現了快速對接。2月7日之前,英偉達、微軟、亞馬遜、華為云、騰訊云等行業領軍企業已密集推出了基于DeepSeek模型的產品或服務,以期分食這一快速增長的用戶市場。
DeepSeek之所以在短時間內獲得全球性擁抱,關鍵原因在于其模型全面開源,并兼容主流硬件與軟件平臺。全球各大云廠商與芯片廠商都希望藉由DeepSeek快速增長的人氣,擴大自身生態體系的影響力。
天數智芯相關負責人向中國城市報記者表示,DeepSeek與國內自主GPU適配的工作持續推進,不僅能實現更高效的深度學習框架融合,同時也能減少對國外硬件平臺的依賴?!斑@對國內人工智能產業鏈的自主可控意義深遠。未來隨著DeepSeek模型的進一步升級,加之硬件與軟件的協同優化,AI應用落地的門檻將被大大降低?!?/p>
在受訪專家看來,DeepSeek的熱度并非曇花一現,而是背后蘊含了“算法革命”與“應用落地”的雙重價值。一方面,通過對模型結構與訓練流程的改進,DeepSeek在性能與成本之間找到了更優解;另一方面,開源策略吸引全球開發者貢獻力量,形成“反哺”式生態,進一步推動算法演進與商業化落地。
《中國城市報》(2025年02月10日第11版)