新聞中心

EEPW首頁 > 智能計算 > 設(shè)計應用 > GenAI的驚人速度正在重塑半導體行業(yè)

GenAI的驚人速度正在重塑半導體行業(yè)

—— 對支持訓練和推理的高級云 SoC 的強勁需求打破了關(guān)于半導體市場變化速度的假設(shè)。
作者: 時間:2025-07-11 來源: 收藏

人類正在目睹一場如此極端的技術(shù)革命,其全部規(guī)??赡艹鑫覀兊闹橇Ψ秶?。生成式 AI () 的性能每六個月翻一番 [1],超過了業(yè)界所說的超級摩爾定律的摩爾定律。一些云 AI 芯片制造商預計未來十年每年的性能將翻倍或翻三倍 [2]。在這個由三部分組成的博客系列中,我們將探討當今的格局和創(chuàng)新芯片制造商戰(zhàn)略,在第二部分深入探討未來的重大挑戰(zhàn),并在第三部分通過研究推動 AI 未來的新興變化和技術(shù)來結(jié)束。

按照這種爆炸性的速度,專家預測通用人工智能 (AGI) 將在 2030 年左右實現(xiàn) [3][4],緊隨其后的是人工智能超級智能 (ASI) [5]。AGI 將擁有類似人類的推理能力,而 ASI 將超越它,重新編程自己,即使是最專業(yè)的頭腦也無法理解。AGI 通過自我修飾迅速演變?yōu)?ASI,俗稱智能爆炸。

下圖使這種指數(shù)加速度不容忽視。在短短幾年內(nèi),AI 在許多曾經(jīng)被認為需要深厚專業(yè)知識的復雜任務(wù)中超越了人類的表現(xiàn)。它還迅速接近其他領(lǐng)域,例如推理、數(shù)學問題解決和代碼生成。幾十年停滯不前的功能現(xiàn)在只需幾個月即可實現(xiàn)飛躍。如果保持這種速度,AI 將很快在幾乎所有認知領(lǐng)域都超過人類,將 AGI 從理論變?yōu)楸厝弧?/p>

??

比較 AI 和人類在不同領(lǐng)域的能力。當 AI 的性能越過零線時,它的得分比人類高 [6]。

這種快速發(fā)展對行業(yè)的影響是深遠的,因為 正在推動對支持訓練和推理的高級云 的強勁需求。分析師預測,到 2030 年,這一專業(yè)領(lǐng)域?qū)⒔咏?3000 億美元,復合年增長率接近 33% [7]。

這種激增的需求打破了關(guān)于市場變化速度的舊假設(shè), 的快速發(fā)展證明他們可以在一夜之間顛覆它。該圖表顯示,生成式 AI 在兩年內(nèi)達到了 PC 需要近十年才能達到的采用水平,甚至比智能手機、平板電腦 [8] 和互聯(lián)網(wǎng)還要快。

生成式 AI 的采用率超過了早期的 PC 和互聯(lián)網(wǎng)使用量,因為 39.4% 的 18-64 歲美國人報告在 ChatGPT(生成式預訓練轉(zhuǎn)換器)發(fā)布后的兩年內(nèi)使用它 [9],使其成為歷史上增長最快的技術(shù) [10]。

地緣政治進一步放大了這些市場震動。美中科技競爭已將半導體變成兩個超級大國軍備競賽的戰(zhàn)略資產(chǎn)。美國實施了廣泛的出口限制,阻止中國獲得美國的人工智能處理器,旨在減緩其實現(xiàn) AGI 的進展 [11]。中國正在通過顛覆性舉措進行反擊,例如開源 DeepSeek-R1,由于美國的芯片限制,該芯片是使用早期芯片構(gòu)建的。

實現(xiàn)產(chǎn)量最大化的多樣化芯片制造商策略

下表匯編了幾款領(lǐng)先的 AI 芯片的最新規(guī)格。所有數(shù)字均基于單芯片,而不是多芯片系統(tǒng),例如 NVIDIA 的 GB200 NVL4。僅包含發(fā)布時可用的芯片。

這些數(shù)據(jù)提供了一個高層次的概述,而不是嚴格的同類比較,后者需要在相同的工作負載和條件下測試所有芯片。每瓦性能 (PPW) 是通過計算 (PFLOPS?1000)/瓦特 (PFLOPS·1000)/瓦特來推導出的,但一些芯片制造商并未公開披露瓦數(shù)(參見下面的 N/A)。

該表的構(gòu)建主要依賴于官方供應商規(guī)范和信譽良好的第三方來源。在少數(shù)情況下,會推斷值,例如根據(jù) 8 位浮點 (FP8) Peta 每秒浮點運算數(shù) (PFLOPS) 估計 16 位浮點 (FP16) 性能。

市場上一些最受歡迎的云 AI 加速器的鳥瞰圖。*片上 SRAM,與其他使用片外 HBM 的芯片不同。

像這樣并排比較所有供應商,揭示了 AI 加速器設(shè)計中的不同策略:

  • NVIDIA 和 AMD 憑借基于 GPU 的架構(gòu)和海量 HBM 內(nèi)存帶寬占據(jù)主導地位。

  • AWS、Google 和 Microsoft 依賴于針對其數(shù)據(jù)中心優(yōu)化的定制芯片。

  • Cerebras 和 Groq 推動了新型架構(gòu),如晶圓級芯片和數(shù)據(jù)流執(zhí)行。例如,Cerebras 從單個芯片提供 125 PFLOPS 和 21 PB/s 帶寬。同時,Groq 強調(diào)超低延遲的數(shù)據(jù)流路徑,以減少推理延遲。

生成式 AI 的加速發(fā)展不僅改變了技術(shù),還重塑了半導體行業(yè)并加劇了地緣政治緊張局勢。隨著芯片制造商競相提供前所未有的處理能力和效率,所部署的策略多種多樣且具有創(chuàng)新性,但挑戰(zhàn)卻是深遠的。這種快速進展伴隨著重大障礙,尤其是對于基于云的 AI 部署,其中有效和可持續(xù)地擴展變得越來越復雜。

引用

  1. 薩蘭,C.(2024 年)。Microsoft Ignite:AI 功能每六個月翻一番

  2. 黃 J. (2024)。NVIDIA 首席執(zhí)行官黃仁勛預測 AI 將以“超級摩爾定律”的速度發(fā)展。巴倫周刊。

  3. 阿莫迪,D.(2024 年)。Anthropic Chief:到明年,AI 可能比所有人類都更聰明。泰晤士報。

  4. 庫茲韋爾,R.(2024 年)。AI 領(lǐng)導者討論該技術(shù)的變革潛力。時間。

  5. 戈策爾,B.(2024 年)。人工智能超級智能可能在 2027 年到來。未來主義。

  6. Kiela, D., Thrush, T., Ethayarajh, K., & Singh, A. (2023)。在 AI 中繪制進度。情境化 AI 博客。

  7. 下一步戰(zhàn)略咨詢。(2025). 人工智能 (AI) 芯片市場報告。

  8. 內(nèi)幕情報。(2023). 生成式 AI 的采用速度比智能手機和平板電腦攀升得更快。eMarketer 的

  9. 圣路易斯聯(lián)邦儲備銀行。(2024). 生成式 AI 的快速采用。

  10. 福布斯。(2023). 突然人工智能:歷史上采用最快的商業(yè)技術(shù)。

  11. 卡奇瓦拉,Z.(2025 年)。NVIDIA 面臨美國 AI 芯片新出口限制的收入威脅。路透社。


關(guān)鍵詞: GenAI 半導體 SoC

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉