DeepSeek如何撼動全球AI市場

2025年02月11日 17:14:23 來源：中國城市報 作者：中國城市報記者孫雪霏

近期，中國人工智能初創(chuàng)企業(yè)——深度求索公司（DeepSeek）憑借其開源大模型R1及前代V3，成為撬動全球科技版圖的一把“新杠桿”。與硅谷“燒錢堆算力”不同，DeepSeek通過算法革命將模型訓(xùn)練成本降低了約60%，僅以557.6萬美元的純算力投入實現(xiàn)了性能對標(biāo)GPT-4o的成績，并以開源策略吸引全球開發(fā)者目光。業(yè)內(nèi)人士普遍認(rèn)為，“低成本、高精度”正在沖擊著以美歐企業(yè)為中心的AI敘事與競爭規(guī)則。

在這一背景下，從華爾街資本市場劇烈震蕩，到微軟、華為等巨頭火速適配DeepSeek的產(chǎn)品，“DeepSeek現(xiàn)象”早已不僅是一場新興技術(shù)突圍的故事，更成為國際科技競爭格局重塑的觀察窗口。它正向人們提出了新的問題——當(dāng)中國AI企業(yè)以算法創(chuàng)新突圍，全球AI賽道是否將迎來全新的規(guī)則重估？

嶄露頭角：

性能卓越，用戶體驗佳

“起初以為又是炒作概念的AI產(chǎn)品，現(xiàn)在想想還是不可思議。”某科技公司數(shù)據(jù)分析師高天宇向中國城市報記者展示他手機端的DeepSeek應(yīng)用界面時，依然難掩驚喜。作為一名95后科技愛好者，他在兩個月前偶然試用DeepSeek，原本想做一次簡單的新能源汽車市場分析，沒想到一段關(guān)于近五年政策變化的深度解析瞬間改變了他的看法。

“當(dāng)時要準(zhǔn)備行業(yè)報告，就隨口讓DeepSeek梳理近五年新能源汽車相關(guān)的中央及地方政策。”高天宇回憶道，“它先列出12項關(guān)鍵政策，然后結(jié)合動態(tài)數(shù)據(jù)模型，逐層推演對產(chǎn)業(yè)鏈的影響，最終還得出了‘2025年電池技術(shù)迭代窗口期’的觀點。這個系統(tǒng)層層遞進的邏輯讓人眼前一亮，就像有個專家團隊在幫我拆解問題，很多視角比專業(yè)咨詢報告還透徹。”

現(xiàn)在，小高的工作界面里常駐兩個窗口——Excel和DeepSeek。他告訴中國城市報記者，平時撰寫材料會用DeepSeek來核對數(shù)據(jù)口徑，處理客戶需求時則讓它生成備選方案，甚至做PPT也會先讓AI搭好框架。“上周有個項目需要處理200份問卷的數(shù)據(jù)，它用交叉分析法三分鐘就找出了潛在矛盾點，以往得折騰半天。”他打開工作日志，指著最近三個月的效率曲線，“項目交付效率整整提升了40%。”

更讓小高意外的是，這個“智能助手”無形中還拓寬了他的知識面。“前天分析長三角產(chǎn)業(yè)轉(zhuǎn)移，它又列舉德國魯爾區(qū)轉(zhuǎn)型案例，提醒我關(guān)注技術(shù)工人流動數(shù)據(jù)。現(xiàn)在遇到復(fù)雜問題不先問問DeepSeek，總覺得缺了道‘保險栓’。”說著，他又習(xí)慣性地點開DeepSeek，“這滿屏的行業(yè)術(shù)語和本土數(shù)據(jù)，優(yōu)勢可不只是技術(shù)參數(shù)能體現(xiàn)的。咱們的‘東方力量’，真不比ChatGPT差！”

DeepSeek是啥

DeepSeek背后的核心研發(fā)力量，最初源自幻方量化在GPU訓(xùn)練量化交易模型方面的經(jīng)驗。幻方量化是國內(nèi)率先囤積過萬塊高端GPU用于大模型研發(fā)的企業(yè)之一，GPU儲備規(guī)模甚至比肩國內(nèi)一線互聯(lián)網(wǎng)公司，遠(yuǎn)超國內(nèi)主流大模型創(chuàng)業(yè)團隊。

DeepSeek在海外“出圈”，始于2024年12月的一系列重量級發(fā)布。當(dāng)月，公司推出了開源模型DeepSeek-V3，測試顯示該模型在多項評測中優(yōu)于主流開源方案，并且在保持高水準(zhǔn)的同時具備明顯的成本優(yōu)勢。其能力可與閉源的GPT-4o相近，但訓(xùn)練只用了2048張英偉達H800 AI芯片，純算力成本僅為557.6萬美元，比Meta發(fā)布的Llama-3-405B的一個訓(xùn)練周期還低了一個數(shù)量級。

時間進入2025年1月，DeepSeek發(fā)布了對標(biāo)OpenAI最新推理模型o1的DeepSeek-R1，號稱在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上實現(xiàn)了新的“自發(fā)涌現(xiàn)”式推理能力，并將其免費開源。與此形成鮮明對比的是，OpenAI、英偉達等巨頭正醞釀大規(guī)模算力基建計劃，涉及高達5000億美元的投資。這樣一來，DeepSeek的“純算法”打法令全球行業(yè)目光紛紛聚焦。

北京郵電大學(xué)人工智能學(xué)院人機交互與認(rèn)知工程實驗室主任劉偉向中國城市報記者表示，DeepSeek的關(guān)鍵在于算法層面的突破和優(yōu)化，大幅節(jié)省了算力與數(shù)據(jù)需求。“如果說OpenAI是‘大力出奇跡’，DeepSeek則證明‘小力也能出奇跡’。”在產(chǎn)業(yè)普遍受到算力和資源限制的當(dāng)下，這種思路無疑展現(xiàn)出可觀的競爭力。

市場反應(yīng)：

美國科技股估值回調(diào)，

源于對算力霸權(quán)的質(zhì)疑

DeepSeek系列模型推出后，如同在市場上投下一枚“震撼彈”，直接導(dǎo)致以英偉達為代表的美國科技股出現(xiàn)大幅波動。相比之下，國內(nèi)AI產(chǎn)業(yè)界對DeepSeek訓(xùn)練成本低的消息并不感到意外。

一位頭部大模型公司技術(shù)負(fù)責(zé)人向中國城市報記者分析：“557.6萬美元只是單次訓(xùn)練純算力成本；如果要加上預(yù)實驗、數(shù)據(jù)清洗等流程，實際成本肯定要翻倍。但無論如何，相比國外閉源大模型，它依舊保持了極強的成本控制力。而且隨著時間推移，后來者總比先驅(qū)更具成本優(yōu)勢，尤其在算法和數(shù)據(jù)管理上會更為成熟。”

《大西洋月刊》CEO湯普森表示，中國的開源模型在使用相對較少數(shù)據(jù)進行訓(xùn)練的情況下，也能產(chǎn)出與OpenAI或Claude相當(dāng)?shù)男Ч@對于減少能耗、提高效率具有重要意義。

事實上，國內(nèi)大模型創(chuàng)業(yè)公司普遍在算力、資金方面面臨嚴(yán)峻限制，因而更傾向在軟件、算法和工程優(yōu)化層面尋找突破。DeepSeek獨辟蹊徑，通過更高效的計算拓?fù)浜湍Ｐ徒Y(jié)構(gòu)設(shè)計，在保持相近性能的情況下，把算力成本砍掉近60%。“別人用100元訓(xùn)練，DeepSeek用40元就能搞定，很多投資人一下子看到了大模型企業(yè)的新思路。”一位業(yè)內(nèi)資深分析師評價道，“這不只是技術(shù)路線的博弈，更重要的是為打破硅谷——華爾街聯(lián)合主導(dǎo)的AI敘事，打開了一條新通道。”

DeepSeek的問世被外界比喻為神秘的東方力量。“在極其有限的資源條件下，通過算法層面的精心設(shè)計反超對手，展現(xiàn)了中國工程師文化與成本意識的雙重優(yōu)勢。”該分析師同時指出，DeepSeek的成功為業(yè)界提供了一個關(guān)鍵啟示：在基礎(chǔ)硬件和數(shù)據(jù)資源都有限的前提下，如何通過算法和工程能力實現(xiàn)質(zhì)的飛躍，是未來AI大模型產(chǎn)業(yè)亟待解決的核心命題。

硅谷巨頭的技術(shù)路徑被挑戰(zhàn)

Meta內(nèi)部一位工程師在公司員工社區(qū)中直言：“DeepSeek極低的訓(xùn)練成本，讓管理層開始擔(dān)憂此前投入數(shù)百億美元進行生成式AI研發(fā)的必要性。”當(dāng)“燒錢堆算力”不再是唯一可行道路，新創(chuàng)企業(yè)與巨頭之間的鴻溝便不再涇渭分明。深層次來看，DeepSeek以“省錢省力”的方式取得媲美GPT-4o、o1的模型表現(xiàn)，其背后是一場工程實用主義對技術(shù)理想主義的沖擊。

在OpenAI、甲骨文、英偉達等聯(lián)合宣布啟動高達5000億美元算力基建計劃的節(jié)骨眼上，DeepSeek卻用不到六成成本訓(xùn)練出同等規(guī)模和精度的大模型，不僅為“重資產(chǎn)”的美國AI生態(tài)敲響了警鐘，更令他們對硬件與資金堆積模式的前景產(chǎn)生疑慮。國內(nèi)一家大型科技公司的AI研究負(fù)責(zé)人接受采訪時表示：“當(dāng)工程優(yōu)化帶來的邊際收益遠(yuǎn)高于單純加芯片的線性增長，硅谷多年來賴以維系的技術(shù)優(yōu)勢就需要重新評估。”

換言之，DeepSeek的出現(xiàn)也挑戰(zhàn)了美國AI巨頭在資本與市場層面的敘事框架。對于真正需要盈利和長期發(fā)展的企業(yè)而言，控制成本、提高效率、獲得更高社會接受度才是硬道理。

“我們當(dāng)然為這一突破感到自豪，但也要保持清醒。”該國內(nèi)大型科技公司負(fù)責(zé)人稱，“不是每一家企業(yè)都能像OpenAI或xAI一樣，一輪就融到幾十億美元。DeepSeek的路線具有極強的實用價值，對那些資金鏈并不充裕的AI企業(yè)而言，這無疑是一種更現(xiàn)實的突圍方式。”

跨國科技企業(yè)爭相適配搶灘DeepSeek生態(tài)

當(dāng)華爾街與硅谷仍在激辯DeepSeek的沖擊時，國際科技巨頭們已率先行動，與DeepSeek-R1模型實現(xiàn)了快速對接。2月7日之前，英偉達、微軟、亞馬遜、華為云、騰訊云等行業(yè)領(lǐng)軍企業(yè)已密集推出了基于DeepSeek模型的產(chǎn)品或服務(wù)，以期分食這一快速增長的用戶市場。

DeepSeek之所以在短時間內(nèi)獲得全球性擁抱，關(guān)鍵原因在于其模型全面開源，并兼容主流硬件與軟件平臺。全球各大云廠商與芯片廠商都希望藉由DeepSeek快速增長的人氣，擴大自身生態(tài)體系的影響力。

天數(shù)智芯相關(guān)負(fù)責(zé)人向中國城市報記者表示，DeepSeek與國內(nèi)自主GPU適配的工作持續(xù)推進，不僅能實現(xiàn)更高效的深度學(xué)習(xí)框架融合，同時也能減少對國外硬件平臺的依賴。“這對國內(nèi)人工智能產(chǎn)業(yè)鏈的自主可控意義深遠(yuǎn)。未來隨著DeepSeek模型的進一步升級，加之硬件與軟件的協(xié)同優(yōu)化，AI應(yīng)用落地的門檻將被大大降低。”

在受訪專家看來，DeepSeek的熱度并非曇花一現(xiàn)，而是背后蘊含了“算法革命”與“應(yīng)用落地”的雙重價值。一方面，通過對模型結(jié)構(gòu)與訓(xùn)練流程的改進，DeepSeek在性能與成本之間找到了更優(yōu)解；另一方面，開源策略吸引全球開發(fā)者貢獻力量，形成“反哺”式生態(tài)，進一步推動算法演進與商業(yè)化落地。

《中國城市報》（2025年02月10日第11版）

責(zé)任編輯：越玥