近期,中國人工智能初創(chuàng)企業(yè)——深度求索公司(DeepSeek)憑借其開源大模型R1及前代V3,成為撬動全球科技版圖的一把“新杠桿”。與硅谷“燒錢堆算力”不同,DeepSeek通過算法革命將模型訓(xùn)練成本降低了約60%,僅以557.6萬美元的純算力投入實現(xiàn)了性能對標(biāo)GPT-4o的成績,并以開源策略吸引全球開發(fā)者目光。業(yè)內(nèi)人士普遍認(rèn)為,“低成本、高精度”正在沖擊著以美歐企業(yè)為中心的AI敘事與競爭規(guī)則。
在這一背景下,從華爾街資本市場劇烈震蕩,到微軟、華為等巨頭火速適配DeepSeek的產(chǎn)品,“DeepSeek現(xiàn)象”早已不僅是一場新興技術(shù)突圍的故事,更成為國際科技競爭格局重塑的觀察窗口。它正向人們提出了新的問題——當(dāng)中國AI企業(yè)以算法創(chuàng)新突圍,全球AI賽道是否將迎來全新的規(guī)則重估?
嶄露頭角:
性能卓越,用戶體驗佳
“起初以為又是炒作概念的AI產(chǎn)品,現(xiàn)在想想還是不可思議。”某科技公司數(shù)據(jù)分析師高天宇向中國城市報記者展示他手機端的DeepSeek應(yīng)用界面時,依然難掩驚喜。作為一名95后科技愛好者,他在兩個月前偶然試用DeepSeek,原本想做一次簡單的新能源汽車市場分析,沒想到一段關(guān)于近五年政策變化的深度解析瞬間改變了他的看法。
“當(dāng)時要準(zhǔn)備行業(yè)報告,就隨口讓DeepSeek梳理近五年新能源汽車相關(guān)的中央及地方政策。”高天宇回憶道,“它先列出12項關(guān)鍵政策,然后結(jié)合動態(tài)數(shù)據(jù)模型,逐層推演對產(chǎn)業(yè)鏈的影響,最終還得出了‘2025年電池技術(shù)迭代窗口期’的觀點。這個系統(tǒng)層層遞進的邏輯讓人眼前一亮,就像有個專家團隊在幫我拆解問題,很多視角比專業(yè)咨詢報告還透徹。”
現(xiàn)在,小高的工作界面里常駐兩個窗口——Excel和DeepSeek。他告訴中國城市報記者,平時撰寫材料會用DeepSeek來核對數(shù)據(jù)口徑,處理客戶需求時則讓它生成備選方案,甚至做PPT也會先讓AI搭好框架。“上周有個項目需要處理200份問卷的數(shù)據(jù),它用交叉分析法三分鐘就找出了潛在矛盾點,以往得折騰半天。”他打開工作日志,指著最近三個月的效率曲線,“項目交付效率整整提升了40%。”
更讓小高意外的是,這個“智能助手”無形中還拓寬了他的知識面。“前天分析長三角產(chǎn)業(yè)轉(zhuǎn)移,它又列舉德國魯爾區(qū)轉(zhuǎn)型案例,提醒我關(guān)注技術(shù)工人流動數(shù)據(jù)。現(xiàn)在遇到復(fù)雜問題不先問問DeepSeek,總覺得缺了道‘保險栓’。”說著,他又習(xí)慣性地點開DeepSeek,“這滿屏的行業(yè)術(shù)語和本土數(shù)據(jù),優(yōu)勢可不只是技術(shù)參數(shù)能體現(xiàn)的。咱們的‘東方力量’,真不比ChatGPT差!”
DeepSeek是啥
DeepSeek背后的核心研發(fā)力量,最初源自幻方量化在GPU訓(xùn)練量化交易模型方面的經(jīng)驗。幻方量化是國內(nèi)率先囤積過萬塊高端GPU用于大模型研發(fā)的企業(yè)之一,GPU儲備規(guī)模甚至比肩國內(nèi)一線互聯(lián)網(wǎng)公司,遠(yuǎn)超國內(nèi)主流大模型創(chuàng)業(yè)團隊。
DeepSeek在海外“出圈”,始于2024年12月的一系列重量級發(fā)布。當(dāng)月,公司推出了開源模型DeepSeek-V3,測試顯示該模型在多項評測中優(yōu)于主流開源方案,并且在保持高水準(zhǔn)的同時具備明顯的成本優(yōu)勢。其能力可與閉源的GPT-4o相近,但訓(xùn)練只用了2048張英偉達H800 AI芯片,純算力成本僅為557.6萬美元,比Meta發(fā)布的Llama-3-405B的一個訓(xùn)練周期還低了一個數(shù)量級。
時間進入2025年1月,DeepSeek發(fā)布了對標(biāo)OpenAI最新推理模型o1的DeepSeek-R1,號稱在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上實現(xiàn)了新的“自發(fā)涌現(xiàn)”式推理能力,并將其免費開源。與此形成鮮明對比的是,OpenAI、英偉達等巨頭正醞釀大規(guī)模算力基建計劃,涉及高達5000億美元的投資。這樣一來,DeepSeek的“純算法”打法令全球行業(yè)目光紛紛聚焦。
北京郵電大學(xué)人工智能學(xué)院人機交互與認(rèn)知工程實驗室主任劉偉向中國城市報記者表示,DeepSeek的關(guān)鍵在于算法層面的突破和優(yōu)化,大幅節(jié)省了算力與數(shù)據(jù)需求。“如果說OpenAI是‘大力出奇跡’,DeepSeek則證明‘小力也能出奇跡’。”在產(chǎn)業(yè)普遍受到算力和資源限制的當(dāng)下,這種思路無疑展現(xiàn)出可觀的競爭力。
市場反應(yīng):
美國科技股估值回調(diào),
源于對算力霸權(quán)的質(zhì)疑
DeepSeek系列模型推出后,如同在市場上投下一枚“震撼彈”,直接導(dǎo)致以英偉達為代表的美國科技股出現(xiàn)大幅波動。相比之下,國內(nèi)AI產(chǎn)業(yè)界對DeepSeek訓(xùn)練成本低的消息并不感到意外。
一位頭部大模型公司技術(shù)負(fù)責(zé)人向中國城市報記者分析:“557.6萬美元只是單次訓(xùn)練純算力成本;如果要加上預(yù)實驗、數(shù)據(jù)清洗等流程,實際成本肯定要翻倍。但無論如何,相比國外閉源大模型,它依舊保持了極強的成本控制力。而且隨著時間推移,后來者總比先驅(qū)更具成本優(yōu)勢,尤其在算法和數(shù)據(jù)管理上會更為成熟。”
《大西洋月刊》CEO湯普森表示,中國的開源模型在使用相對較少數(shù)據(jù)進行訓(xùn)練的情況下,也能產(chǎn)出與OpenAI或Claude相當(dāng)?shù)男Ч@對于減少能耗、提高效率具有重要意義。
事實上,國內(nèi)大模型創(chuàng)業(yè)公司普遍在算力、資金方面面臨嚴(yán)峻限制,因而更傾向在軟件、算法和工程優(yōu)化層面尋找突破。DeepSeek獨辟蹊徑,通過更高效的計算拓?fù)浜湍P徒Y(jié)構(gòu)設(shè)計,在保持相近性能的情況下,把算力成本砍掉近60%。“別人用100元訓(xùn)練,DeepSeek用40元就能搞定,很多投資人一下子看到了大模型企業(yè)的新思路。”一位業(yè)內(nèi)資深分析師評價道,“這不只是技術(shù)路線的博弈,更重要的是為打破硅谷——華爾街聯(lián)合主導(dǎo)的AI敘事,打開了一條新通道。”
DeepSeek的問世被外界比喻為神秘的東方力量。“在極其有限的資源條件下,通過算法層面的精心設(shè)計反超對手,展現(xiàn)了中國工程師文化與成本意識的雙重優(yōu)勢。”該分析師同時指出,DeepSeek的成功為業(yè)界提供了一個關(guān)鍵啟示:在基礎(chǔ)硬件和數(shù)據(jù)資源都有限的前提下,如何通過算法和工程能力實現(xiàn)質(zhì)的飛躍,是未來AI大模型產(chǎn)業(yè)亟待解決的核心命題。
硅谷巨頭的技術(shù)路徑被挑戰(zhàn)
Meta內(nèi)部一位工程師在公司員工社區(qū)中直言:“DeepSeek極低的訓(xùn)練成本,讓管理層開始擔(dān)憂此前投入數(shù)百億美元進行生成式AI研發(fā)的必要性。”當(dāng)“燒錢堆算力”不再是唯一可行道路,新創(chuàng)企業(yè)與巨頭之間的鴻溝便不再涇渭分明。深層次來看,DeepSeek以“省錢省力”的方式取得媲美GPT-4o、o1的模型表現(xiàn),其背后是一場工程實用主義對技術(shù)理想主義的沖擊。
在OpenAI、甲骨文、英偉達等聯(lián)合宣布啟動高達5000億美元算力基建計劃的節(jié)骨眼上,DeepSeek卻用不到六成成本訓(xùn)練出同等規(guī)模和精度的大模型,不僅為“重資產(chǎn)”的美國AI生態(tài)敲響了警鐘,更令他們對硬件與資金堆積模式的前景產(chǎn)生疑慮。國內(nèi)一家大型科技公司的AI研究負(fù)責(zé)人接受采訪時表示:“當(dāng)工程優(yōu)化帶來的邊際收益遠(yuǎn)高于單純加芯片的線性增長,硅谷多年來賴以維系的技術(shù)優(yōu)勢就需要重新評估。”
換言之,DeepSeek的出現(xiàn)也挑戰(zhàn)了美國AI巨頭在資本與市場層面的敘事框架。對于真正需要盈利和長期發(fā)展的企業(yè)而言,控制成本、提高效率、獲得更高社會接受度才是硬道理。
“我們當(dāng)然為這一突破感到自豪,但也要保持清醒。”該國內(nèi)大型科技公司負(fù)責(zé)人稱,“不是每一家企業(yè)都能像OpenAI或xAI一樣,一輪就融到幾十億美元。DeepSeek的路線具有極強的實用價值,對那些資金鏈并不充裕的AI企業(yè)而言,這無疑是一種更現(xiàn)實的突圍方式。”
跨國科技企業(yè)爭相適配 搶灘DeepSeek生態(tài)
當(dāng)華爾街與硅谷仍在激辯DeepSeek的沖擊時,國際科技巨頭們已率先行動,與DeepSeek-R1模型實現(xiàn)了快速對接。2月7日之前,英偉達、微軟、亞馬遜、華為云、騰訊云等行業(yè)領(lǐng)軍企業(yè)已密集推出了基于DeepSeek模型的產(chǎn)品或服務(wù),以期分食這一快速增長的用戶市場。
DeepSeek之所以在短時間內(nèi)獲得全球性擁抱,關(guān)鍵原因在于其模型全面開源,并兼容主流硬件與軟件平臺。全球各大云廠商與芯片廠商都希望藉由DeepSeek快速增長的人氣,擴大自身生態(tài)體系的影響力。
天數(shù)智芯相關(guān)負(fù)責(zé)人向中國城市報記者表示,DeepSeek與國內(nèi)自主GPU適配的工作持續(xù)推進,不僅能實現(xiàn)更高效的深度學(xué)習(xí)框架融合,同時也能減少對國外硬件平臺的依賴。“這對國內(nèi)人工智能產(chǎn)業(yè)鏈的自主可控意義深遠(yuǎn)。未來隨著DeepSeek模型的進一步升級,加之硬件與軟件的協(xié)同優(yōu)化,AI應(yīng)用落地的門檻將被大大降低。”
在受訪專家看來,DeepSeek的熱度并非曇花一現(xiàn),而是背后蘊含了“算法革命”與“應(yīng)用落地”的雙重價值。一方面,通過對模型結(jié)構(gòu)與訓(xùn)練流程的改進,DeepSeek在性能與成本之間找到了更優(yōu)解;另一方面,開源策略吸引全球開發(fā)者貢獻力量,形成“反哺”式生態(tài),進一步推動算法演進與商業(yè)化落地。
《中國城市報》(2025年02月10日第11版)
《中國城市報》社有限公司版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright ? 2015-2025 by www.yktax-zh.com. all rights reserved