GenAI的驚人速度正在重塑半導體行業(yè)
人類正在目睹一場如此極端的技術(shù)革命,其全部規(guī)??赡艹鑫覀兊闹橇Ψ秶?。生成式 AI (GenAI) 的性能每六個月翻一番 [1],超過了業(yè)界所說的超級摩爾定律的摩爾定律。一些云 AI 芯片制造商預計未來十年每年的性能將翻倍或翻三倍 [2]。在這個由三部分組成的博客系列中,我們將探討當今的半導體格局和創(chuàng)新芯片制造商戰(zhàn)略,在第二部分深入探討未來的重大挑戰(zhàn),并在第三部分通過研究推動 AI 未來的新興變化和技術(shù)來結(jié)束。
按照這種爆炸性的速度,專家預測通用人工智能 (AGI) 將在 2030 年左右實現(xiàn) [3][4],緊隨其后的是人工智能超級智能 (ASI) [5]。AGI 將擁有類似人類的推理能力,而 ASI 將超越它,重新編程自己,即使是最專業(yè)的頭腦也無法理解。AGI 通過自我修飾迅速演變?yōu)?ASI,俗稱智能爆炸。
下圖使這種指數(shù)加速度不容忽視。在短短幾年內(nèi),AI 在許多曾經(jīng)被認為需要深厚專業(yè)知識的復雜任務(wù)中超越了人類的表現(xiàn)。它還迅速接近其他領(lǐng)域,例如推理、數(shù)學問題解決和代碼生成。幾十年停滯不前的功能現(xiàn)在只需幾個月即可實現(xiàn)飛躍。如果保持這種速度,AI 將很快在幾乎所有認知領(lǐng)域都超過人類,將 AGI 從理論變?yōu)楸厝弧?/p>
?
比較 AI 和人類在不同領(lǐng)域的能力。當 AI 的性能越過零線時,它的得分比人類高 [6]。
這種快速發(fā)展對半導體行業(yè)的影響是深遠的,因為 GenAI 正在推動對支持訓練和推理的高級云 SoC 的強勁需求。分析師預測,到 2030 年,這一專業(yè)領(lǐng)域?qū)⒔咏?3000 億美元,復合年增長率接近 33% [7]。
這種激增的需求打破了關(guān)于半導體市場變化速度的舊假設(shè),GenAI 的快速發(fā)展證明他們可以在一夜之間顛覆它。該圖表顯示,生成式 AI 在兩年內(nèi)達到了 PC 需要近十年才能達到的采用水平,甚至比智能手機、平板電腦 [8] 和互聯(lián)網(wǎng)還要快。
生成式 AI 的采用率超過了早期的 PC 和互聯(lián)網(wǎng)使用量,因為 39.4% 的 18-64 歲美國人報告在 ChatGPT(生成式預訓練轉(zhuǎn)換器)發(fā)布后的兩年內(nèi)使用它 [9],使其成為歷史上增長最快的技術(shù) [10]。
地緣政治進一步放大了這些市場震動。美中科技競爭已將半導體變成兩個超級大國軍備競賽的戰(zhàn)略資產(chǎn)。美國實施了廣泛的出口限制,阻止中國獲得美國的人工智能處理器,旨在減緩其實現(xiàn) AGI 的進展 [11]。中國正在通過顛覆性舉措進行反擊,例如開源 DeepSeek-R1,由于美國的芯片限制,該芯片是使用早期芯片構(gòu)建的。
實現(xiàn)產(chǎn)量最大化的多樣化芯片制造商策略
下表匯編了幾款領(lǐng)先的 AI 芯片的最新規(guī)格。所有數(shù)字均基于單芯片,而不是多芯片系統(tǒng),例如 NVIDIA 的 GB200 NVL4。僅包含發(fā)布時可用的芯片。
這些數(shù)據(jù)提供了一個高層次的概述,而不是嚴格的同類比較,后者需要在相同的工作負載和條件下測試所有芯片。每瓦性能 (PPW) 是通過計算 (PFLOPS?1000)/瓦特 (PFLOPS·1000)/瓦特來推導出的,但一些芯片制造商并未公開披露瓦數(shù)(參見下面的 N/A)。
該表的構(gòu)建主要依賴于官方供應商規(guī)范和信譽良好的第三方來源。在少數(shù)情況下,會推斷值,例如根據(jù) 8 位浮點 (FP8) Peta 每秒浮點運算數(shù) (PFLOPS) 估計 16 位浮點 (FP16) 性能。
市場上一些最受歡迎的云 AI 加速器的鳥瞰圖。*片上 SRAM,與其他使用片外 HBM 的芯片不同。
像這樣并排比較所有供應商,揭示了 AI 加速器設(shè)計中的不同策略:
NVIDIA 和 AMD 憑借基于 GPU 的架構(gòu)和海量 HBM 內(nèi)存帶寬占據(jù)主導地位。
AWS、Google 和 Microsoft 依賴于針對其數(shù)據(jù)中心優(yōu)化的定制芯片。
Cerebras 和 Groq 推動了新型架構(gòu),如晶圓級芯片和數(shù)據(jù)流執(zhí)行。例如,Cerebras 從單個芯片提供 125 PFLOPS 和 21 PB/s 帶寬。同時,Groq 強調(diào)超低延遲的數(shù)據(jù)流路徑,以減少推理延遲。
生成式 AI 的加速發(fā)展不僅改變了技術(shù),還重塑了半導體行業(yè)并加劇了地緣政治緊張局勢。隨著芯片制造商競相提供前所未有的處理能力和效率,所部署的策略多種多樣且具有創(chuàng)新性,但挑戰(zhàn)卻是深遠的。這種快速進展伴隨著重大障礙,尤其是對于基于云的 AI 部署,其中有效和可持續(xù)地擴展變得越來越復雜。
引用
薩蘭,C.(2024 年)。Microsoft Ignite:AI 功能每六個月翻一番
黃 J. (2024)。NVIDIA 首席執(zhí)行官黃仁勛預測 AI 將以“超級摩爾定律”的速度發(fā)展。巴倫周刊。
阿莫迪,D.(2024 年)。Anthropic Chief:到明年,AI 可能比所有人類都更聰明。泰晤士報。
庫茲韋爾,R.(2024 年)。AI 領(lǐng)導者討論該技術(shù)的變革潛力。時間。
戈策爾,B.(2024 年)。人工智能超級智能可能在 2027 年到來。未來主義。
Kiela, D., Thrush, T., Ethayarajh, K., & Singh, A. (2023)。在 AI 中繪制進度。情境化 AI 博客。
下一步戰(zhàn)略咨詢。(2025). 人工智能 (AI) 芯片市場報告。
內(nèi)幕情報。(2023). 生成式 AI 的采用速度比智能手機和平板電腦攀升得更快。eMarketer 的
圣路易斯聯(lián)邦儲備銀行。(2024). 生成式 AI 的快速采用。
福布斯。(2023). 突然人工智能:歷史上采用最快的商業(yè)技術(shù)。
卡奇瓦拉,Z.(2025 年)。NVIDIA 面臨美國 AI 芯片新出口限制的收入威脅。路透社。
評論