DeepSeek改變了硅谷對(duì)AI的認(rèn)知

來(lái)源:《第一財(cái)經(jīng)》YiMagazine
關(guān)鍵字:DeepSeek,AI,認(rèn)知
發(fā)布時(shí)間:2025-04-06 16:38

　　翻譯／萬(wàn)志文

　　一項(xiàng)人工智能突破給股市帶來(lái)了沖擊波，讓硅谷巨頭們感到不安，并引發(fā)了關(guān)于美國(guó)技術(shù)主導(dǎo)地位終結(jié)的大討論。但與這項(xiàng)突破相關(guān)的論文標(biāo)題卻簡(jiǎn)單樸素，頗為學(xué)術(shù)—《通過(guò)強(qiáng)化學(xué)習(xí)激勵(lì)大型語(yǔ)言模型的推理能力》。

　　這篇長(zhǎng)達(dá)22頁(yè)的論文是一家名為DeepSeek的中國(guó)人工智能初創(chuàng)公司在1月22日發(fā)布的，最初并未引發(fā)太大關(guān)注。AI從業(yè)人員大多花了幾天時(shí)間來(lái)消化論文的主張及其所描述的含義。該公司創(chuàng)建了一個(gè)名為DeepSeek-R1的AI模型，并聲稱他們僅使用了數(shù)量不多的二流AI芯片，以極低的成本便能匹敵領(lǐng)先的美國(guó)AI模型的性能。

　　DeepSeek表示，它是通過(guò)巧妙的工程設(shè)計(jì)彌補(bǔ)了計(jì)算能力的不足。一些行業(yè)觀察人士最初對(duì)DeepSeek取得的突破表示難以置信。他們認(rèn)為，DeepSeek肯定是通過(guò)某種作弊手段才取得R1的成果，或者捏造了數(shù)據(jù)，讓模型看起來(lái)比實(shí)際情況更有吸引力。也許R1其實(shí)只是對(duì)美國(guó)AI模型的巧妙改版，并未代表什么真正的進(jìn) 展。

　　最后，隨著越來(lái)越多的人深入研究DeepSeek-R1的細(xì)節(jié)—與市面上大多數(shù)領(lǐng)先的AI模型不同，它是以開源形式發(fā)布的，外界可以更仔細(xì)地探究它的內(nèi)部運(yùn)作—上述的懷疑逐漸轉(zhuǎn)變成了擔(dān)憂。

　　1月下旬，當(dāng)大量美國(guó)人開始親自使用DeepSeek的模型，DeepSeek移動(dòng)應(yīng)用也登頂蘋果App Store排行榜，恐慌情緒徹底爆發(fā)。

　　我認(rèn)為，該公司的小額經(jīng)營(yíng)成本可能被嚴(yán)重夸大了，但我確實(shí)認(rèn)為，DeepSeek-R1的突破是真實(shí)的。DeepSeek論文中的發(fā)現(xiàn)，顯然在挑戰(zhàn)美國(guó)技術(shù)行業(yè)一直以來(lái)的幾個(gè)主要假設(shè)。

　　第一個(gè)假設(shè)是，要構(gòu)建尖端的AI模型，就需要在性能強(qiáng)大的芯片和數(shù)據(jù)中心上投入巨額資金。

　　這一信條在業(yè)界已經(jīng)根深蒂固，怎么強(qiáng)調(diào)都不為過(guò)。微軟、Meta、Google等公司已經(jīng)斥資數(shù)百億美元來(lái)建設(shè)它們認(rèn)為構(gòu)建和運(yùn)行下一代AI模型所需的基礎(chǔ)設(shè)施。OpenAI不久前宣布與甲骨文和軟銀成立的合資企業(yè)，投資高達(dá)5000億美元。

　　DeepSeek似乎僅花了上述公司投入的零頭便訓(xùn)練出了R1。該公司聲稱，他們?cè)谟?xùn)練上一代模型上花費(fèi)了約550萬(wàn)美元。但是，即使R1的訓(xùn)練成本是DeepSeek所聲稱的數(shù)字的10倍，仍然比美國(guó)主流AI公司旗下最強(qiáng)大模型的開發(fā)成本要低好幾個(gè)數(shù)量級(jí)。

　　顯然，我們得出的結(jié)論并不是美國(guó)的技術(shù)巨頭在浪費(fèi)金錢。一旦訓(xùn)練完成，強(qiáng)大的AI模型運(yùn)行成本仍然很高。對(duì)OpenAI和Google這樣的公司來(lái)說(shuō)，投入數(shù)千億美元仍然是合理的，通過(guò)能承受的高昂投入來(lái)保持行業(yè)領(lǐng)先地位也無(wú)可厚非。

　　但是，DeepSeek在成本方面的突破對(duì)近年來(lái)推動(dòng)人工智能軍備競(jìng)賽的模型“越大越好”的說(shuō)法提出了挑戰(zhàn)。人工智能公司可能只需比以前想象的少得多的投資，就能訓(xùn)練出非常強(qiáng)大的模型。這也表明，我們可能很快就會(huì)看到大量資本涌入體量較小的人工智能初創(chuàng)公司。目前由于訓(xùn)練模型成本巨大，硅谷巨頭面臨的主要是彼此之間的競(jìng)爭(zhēng)，未來(lái)它們面臨的競(jìng)爭(zhēng)將會(huì)更加激烈。

　　硅谷人人都在關(guān)注DeepSeek，還有其他技術(shù)上的原因。該公司在論文中透露了一些關(guān)于R1實(shí)際構(gòu)建過(guò)程的細(xì)節(jié)，包括模型蒸餾中的一些尖端技術(shù)：將AI大模型壓縮成更小的模型以降低運(yùn)行成本，性能卻不會(huì)損失太多。DeepSeek還提供了一些細(xì)節(jié)，表明將一個(gè)“普通”的AI語(yǔ)言模型轉(zhuǎn)換成一個(gè)更復(fù)雜的推理模型并不像之前想象的那么難，只需在其基礎(chǔ)上應(yīng)用“強(qiáng)化學(xué)習(xí)”技術(shù)即可。

　　不必?fù)?dān)心看不懂這些術(shù)語(yǔ)—重要的是，以前美國(guó)技術(shù)公司們嚴(yán)密保護(hù)的改進(jìn)人工智能系統(tǒng)的方法現(xiàn)在已經(jīng)在網(wǎng)上公開了，任何人都可以免費(fèi)獲取和復(fù)制。

　　即使美國(guó)技術(shù)巨頭的股價(jià)有所回升，DeepSeek的成功也會(huì)讓市場(chǎng)對(duì)它們的長(zhǎng)期人工智能戰(zhàn)略產(chǎn)生不小的懷疑。比如，如果你是Meta—美國(guó)唯一將自家模型作為免費(fèi)開源軟件發(fā)布的技術(shù)巨頭，還有什么能阻止DeepSeek或其他初創(chuàng)公司將你花費(fèi)數(shù)十億美元開發(fā)的模型，蒸餾提煉成更小、更便宜的模型，然后以極低的價(jià)格推向市場(chǎng)呢？

　　多年來(lái)，許多美國(guó)的人工智能專家（以及聽取他們意見的政策制定者）一直認(rèn)為，美國(guó)在AI競(jìng)賽中至少領(lǐng)先了數(shù)年。現(xiàn)在，這樣的地緣政治假設(shè)已經(jīng)被削弱。美國(guó)公司所取得的突破，對(duì)于中國(guó)公司—至少是一家中國(guó)公司—來(lái)說(shuō)，在幾周內(nèi)復(fù)制出來(lái)可能是非常容易的。

　　DeepSeek的成果還提出了一些問(wèn)題，即美國(guó)政府用于防止強(qiáng)大的人工智能芯片落入中國(guó)手中的出口管制是否如預(yù)期奏效呢？考慮到更有效的新型模型訓(xùn)練方式，這些法規(guī)是否需要調(diào)整？

　　DeepSeek的用戶已經(jīng)注意到，這個(gè)模型經(jīng)常拒絕回答有關(guān)敏感話題的問(wèn)題。作為開源軟件，如果其他開發(fā)者在DeepSeek模型的基礎(chǔ)上開發(fā)，那么這類做法可能會(huì)逐漸蔓延至整個(gè)行業(yè)。

　　我還不確定DeepSeek的突破會(huì)產(chǎn)生怎樣的全面影響，至少，這件事表明了圍繞AI的軍備競(jìng)賽已經(jīng)真正打響，過(guò)去幾年的進(jìn)展令人眼花繚亂，未來(lái)還有更多令人驚訝的事情在等著我們。

關(guān)注讀覽天下微信， 100萬(wàn)篇深度好文，等你來(lái)看……

立即購(gòu)買本期雜志

查看本期更多內(nèi)容

亚洲,欧美,中文字幕,小婕子伦流澡到高潮视频,无码成人aaaaa毛片,性少妇japanesexxxx,山外人精品影院

DeepSeek改變了硅谷對(duì)AI的認(rèn)知