3D器件堆棧的新型組裝方法
半導(dǎo)體封裝的下一個(gè)重大飛躍將需要一系列新技術(shù)、工藝和材料,但總的來(lái)說(shuō),它們將使性能得到數(shù)量級(jí)的提高,這對(duì)于 AI 時(shí)代至關(guān)重要。
并非所有這些問(wèn)題都得到完全解決,但最近的電子元件技術(shù)會(huì)議 (ECTC) 讓我們得以一窺自 ChatGPT 的推出震驚科技界以來(lái),過(guò)去幾年所取得的巨大飛躍。AMD、TSMC、Samsung、Intel 和許多設(shè)備供應(yīng)商詳細(xì)介紹了混合鍵合、玻璃芯基板、微通道或直接冷卻冷卻以及通過(guò)背面電源方案散熱方面的改進(jìn)。
“AI 改變超級(jí)計(jì)算機(jī)/高性能計(jì)算空間的方式令人驚嘆,”AMD 高級(jí)副總裁兼企業(yè)研究員 Sam Naffziger 在關(guān)于 AI 計(jì)算的演講中表示?!癈hatGPT 和 Geminis 已經(jīng)攝取了整個(gè)互聯(lián)網(wǎng)數(shù)據(jù)世界并訓(xùn)練了模型,但高質(zhì)量的文本數(shù)據(jù)已經(jīng)被完全消耗掉了。AI 變得越來(lái)越智能的方式是通過(guò)稱為后訓(xùn)練和測(cè)試時(shí)計(jì)算或思維鏈推理的方法,這是模型相互檢查、生成合成數(shù)據(jù)并迭代響應(yīng)并產(chǎn)生更深思熟慮的結(jié)果的地方。盡管智能的每一次增長(zhǎng)都非常有價(jià)值,但需要多兩到三個(gè)數(shù)量級(jí)的計(jì)算才能獲得智能的線性回報(bào)。因此,對(duì)計(jì)算的需求將繼續(xù)增長(zhǎng),而這樣做是為了降低成本,而這正是我們行業(yè)非常擅長(zhǎng)的。我們改進(jìn)我們的制造流程。我們的產(chǎn)量越來(lái)越高,產(chǎn)量提高,成本下降。隨著這一趨勢(shì)的持續(xù),芯片制造的創(chuàng)新,尤其是封裝的創(chuàng)新將發(fā)揮核心作用。
ECTC 詳細(xì)介紹的主要進(jìn)展包括:
Intel 的混合鍵合低至 1μm 間距;
臺(tái)積電對(duì) CoWoS 的直接冷卻,包括 4 個(gè) SoC 和 6 個(gè) HBM;
ITRI/Brewer Science 的 10 層 RDL,采用聚合物/銅混合鍵合;
佐治亞理工學(xué)院的小芯片作為冷卻劑,通過(guò) TSV/硅柱進(jìn)行液體冷卻;
Corning/Fraunhofer IZM 用于光收發(fā)器的玻璃波導(dǎo);
三星用于移動(dòng)處理器和 DRAM 的銅基加熱塊,以及
Imec 的熱通量與熱點(diǎn)的 3D 多芯片仿真。
熱切屑
的液體冷卻隨著強(qiáng)制空氣冷卻達(dá)到極限,切屑層的液體冷卻開始形成。“我們正在設(shè)法使用高速風(fēng)扇冷卻高達(dá) 1,000 瓦的設(shè)備,而風(fēng)扇功率消耗了大約 20% 的服務(wù)器機(jī)架預(yù)算,而我2R 損失占 10% 到 20%,“Naffziger 說(shuō)。“所以現(xiàn)在我們有 40% 的電力僅用于輸送電流和提取熱量。這顯然不是構(gòu)建高效計(jì)算系統(tǒng)的方法。這就是推動(dòng)直接液體冷卻無(wú)情發(fā)展的原因,這種冷卻在泵和冷凝器中有一些電力開銷,但比具有巨大散熱器的高速風(fēng)扇要小得多。
在會(huì)議上,臺(tái)積電的 Yu-Jen Lien 介紹了一種稱為硅集成微型冷卻器 (IMEC-Si) 的液體冷卻架構(gòu),該架構(gòu)正在使用有機(jī)中介層 (CoWoS-R) 上的 1.6X 標(biāo)線大小的測(cè)試車輛進(jìn)行可靠性測(cè)試。該散熱器旨在模擬 4-SoC、8-HBM 封裝,使用 40°C 水流速 10 升/分鐘,可以耗散超過(guò) 3,000 瓦的均勻功率。這種液體冷卻方法可提供卓越的冷卻效果(高達(dá) 2.5 W/mm)2功率密度)相對(duì)于具有熱界面材料方案的間接液體冷板。
圖 1:使用 10 L/min 水(下圖)的直接液體冷卻 CoWoS 比使用 TIM、蓋子和冷板配置的 CoWoS 散發(fā)更多的熱量。來(lái)源:IEEE ECTC [1]
TSMC 的組裝流程應(yīng)用了一個(gè)保護(hù)層來(lái)覆蓋 SoC 背面的銅柱陣列。將組件翻轉(zhuǎn)到載體晶片上,然后進(jìn)行 C4 碰撞。翻轉(zhuǎn)和保護(hù)層去除后,傳統(tǒng)的 CoWoS 流程之后,在 SoC 周邊分配彈性體密封劑。密封劑可最大限度地減少翹曲并密封芯片到蓋子的區(qū)域?!盎亓骱负螅瑢⒕哂袉蝹€(gè)入口和出口的歧管組裝到集成系統(tǒng)上,該歧管旨在在多個(gè)冷卻室之間實(shí)現(xiàn)均勻的流量分布。”[1]
臺(tái)積電配備 4 個(gè) SoC 和 6 個(gè) HBM 芯片的 3.3X 掩線測(cè)試車經(jīng)歷了 160-190μm 的翹曲范圍,這會(huì)導(dǎo)致蓋子和 SoC 芯片之間的流速和輪廓發(fā)生變化。該封裝通過(guò)了氦氣泄漏測(cè)試和早期可靠性測(cè)試。
對(duì)直接切屑冷卻的需求非常迫切,以至于佐治亞理工學(xué)院提出了一個(gè)新穎的概念,即小芯片作為冷卻劑。“想象一下,我們?cè)O(shè)計(jì)的小芯片成為現(xiàn)成開源社區(qū)的一部分,這些小芯片設(shè)計(jì)具有不同的冷卻能力,比如說(shuō)具有不同的直徑、間距,但也具有不同的 TSV 設(shè)計(jì),”佐治亞理工學(xué)院 3D 包集成中心主任 Muhannad Bakir 說(shuō)。“我們可以在該結(jié)構(gòu)中構(gòu)建獨(dú)特的 TSV 結(jié)構(gòu)、獨(dú)特的冷卻結(jié)構(gòu)以及獨(dú)特的其他功能,以幫助熱能和電力輸送。因此,它實(shí)際上只是成為堆棧中的混合粘合解決方案。Bakir 的小組展示了由硅制成的微型翅片引腳散熱器,具有 5nm TSV(見圖 2),可以冷卻 >300W/cm2。[2]
圖 2:微流體冷卻包括硅散熱器和用于芯片-芯片連接的硅通孔。來(lái)源:IEEE ECTC [2]
另一種冷卻方法在 Samsung 用于移動(dòng)應(yīng)用的新型架構(gòu)中的應(yīng)用處理器頂部放置了一個(gè)加熱塊(見圖 3)。[3] Kyung Don Mun 及其同事探索了一種非對(duì)稱內(nèi)存和處理器結(jié)構(gòu),該結(jié)構(gòu)為處理器、內(nèi)存和基于銅的熱路徑模塊的放置提供了設(shè)計(jì)靈活性。
圖 3:從邏輯結(jié)構(gòu)上的對(duì)稱存儲(chǔ)器(左)切換到處理器上帶有銅熱路徑塊的非對(duì)稱結(jié)構(gòu)(右),改善了具有背面供電網(wǎng)絡(luò)的 2nm 柵極全環(huán)繞邏輯器件的散熱效果。來(lái)源:IEEE ECTC [3]
具有背面供電網(wǎng)絡(luò)的應(yīng)用處理器的 2nm 柵極全環(huán)繞晶體管結(jié)構(gòu)需要將模塊的散熱提高 20%。三星使用 Ansys 的有限元模型來(lái)識(shí)別高風(fēng)險(xiǎn)區(qū)域并仿真翹曲?!癛DL 圖形設(shè)計(jì)優(yōu)化對(duì)于這種異構(gòu)封裝設(shè)計(jì)尤為重要,因?yàn)楸?RDL 容易受到熱機(jī)械應(yīng)力集中和裂紋失效的影響,”Mun 說(shuō)。選擇具有更寬圖形寬度和更長(zhǎng)圖形長(zhǎng)度的再分布層減少了翹曲。成型材料、雙面 RDL 和熱界面材料得到了進(jìn)一步改進(jìn),以實(shí)現(xiàn)更高的導(dǎo)熱性和散熱性。
混合鍵合
細(xì)間距多層有機(jī)再分布層 (RDL) 作為硅中介層和層壓襯底的可行替代品越來(lái)越受歡迎。這種轉(zhuǎn)變是由 RDL 以低成本提供高速互連的能力推動(dòng)的。工業(yè)技術(shù)研究所 (ITRI) 和 Brewer Science 展示了聚合物/銅 RDL 的五層堆疊,然后是銅-銅混合鍵合,針對(duì)高速數(shù)字應(yīng)用中的高 I/O、低回波損耗和低插入損耗。[4]
圖 4:聚合物/銅堆積的再分布層之后是具有受控翹曲的 Cu-Cu 混合鍵合。來(lái)源:IEEE ECTC [4]
在玻璃載體晶圓上構(gòu)建線/空間 RDL (4 至 10μm L/S)后,使用負(fù)色調(diào)光刻膠和 i-line 曝光對(duì)低 k 聚合物 (2.5) 進(jìn)行圖案化,然后進(jìn)行蝕刻、用鈦?zhàn)钃鯇雍豌~填充焊盤,然后用銅 CMP 平坦化?;旌湘I合使用 300°C (1.06 MPa) 的熱壓鍵合,然后通過(guò) UV 激光進(jìn)行載體晶圓解鍵合。低模量、高熱穩(wěn)定性和低吸濕性等聚合物特性旨在實(shí)現(xiàn)多層 RDL 堆棧的低翹曲。
近年來(lái),使用傳統(tǒng)電介質(zhì)(SiO2基/銅)的混合鍵合的間距縮放已經(jīng)從10μm(制造中)擴(kuò)展到1μm(研發(fā)中)。Intel 高級(jí)首席工程師 Adel Elsherbini 和他的同事討論了實(shí)現(xiàn)此類擴(kuò)展所需的一些功能。[5]
圖 5:Intel 使用混合鍵合的研究結(jié)果。來(lái)源:IEEE ECTC [5]
他們的論文指出,系統(tǒng)架構(gòu)通常決定是選擇晶圓到晶圓 (W2W) 還是晶片到晶圓 (D2W) 鍵合。晶圓到晶圓鍵合的主要限制是它需要相同大小的小芯片鍵合。該技術(shù)更成熟,可實(shí)現(xiàn)更精細(xì)的間距。晶片到晶片鍵合沒有尺寸限制,只使用已知良好的晶片。“對(duì)于 C2W 應(yīng)用,隨著 HB 間距繼續(xù)擴(kuò)展到 1μm 及以上,貼裝精度要求突破了當(dāng)前一代芯片鍵合機(jī)的極限。為了確保電氣連續(xù)性,整個(gè)小芯片區(qū)域需要達(dá)到相同的精度水平,低至幾十納米。類似于 W2W 鍵合的跳動(dòng)和變形控制,芯片內(nèi)精度控制變得越來(lái)越重要,“作者說(shuō)。
“傳統(tǒng)的貼裝精度標(biāo)準(zhǔn),如小芯片中心或最差角錯(cuò)位,已經(jīng)不夠用了。D2W 工藝控制在鍵合過(guò)程中變得越來(lái)越復(fù)雜,以更多地關(guān)注每個(gè)小芯片級(jí)別的翹曲控制、芯片成型和鍵合波傳播控制。另一方面,為了量化晶粒內(nèi)部鍵合精度,需要新的對(duì)準(zhǔn)標(biāo)記策略和更好的鍵合后精度測(cè)量計(jì)量,以了解從芯片制備一直到鍵合的小芯片級(jí)變形行為。作者指出,紅外剝離可以重復(fù)使用硅載體晶圓,從而降低擁有成本。
使用背面電源
去除熱量背面供電是一種新穎的互連方案,它在晶圓背面構(gòu)建供電網(wǎng)絡(luò),以顯著降低與向晶體管供電相關(guān)的電壓下降。頂部的互連器僅可自由傳輸信號(hào),從而提供許多電氣優(yōu)勢(shì)。
然而,相對(duì)于標(biāo)準(zhǔn)互連堆棧,這種新方法加劇了熱點(diǎn)問(wèn)題(見圖 6)?!叭绻銖恼娴南鄬?duì)視圖來(lái)看,晶體管中產(chǎn)生的所有熱量都會(huì)直接進(jìn)入硅片,到達(dá)散熱器或冷板,”IBM 研究院高級(jí)技術(shù)人員 Dureseti Chidambarrao 說(shuō)。“但還有一個(gè)額外的不幸情況,你喜歡背面的電源——因?yàn)槟惆央娫春托盘?hào)分開了,所以這是一種不那么復(fù)雜的制造方式——但我們現(xiàn)在面臨著這個(gè)挑戰(zhàn),試圖從這種堆棧中去除熱量,因?yàn)闊峒夥搴蜔犭娐繁焕ё×??!?/p>
圖 6:背面電源會(huì)感應(yīng)出新的熱流模式,因?yàn)橛性雌骷A在金屬堆棧之間。來(lái)源:Laura Peters/半導(dǎo)體工程
IBM 開發(fā)了一個(gè)各向異性模型,可以準(zhǔn)確計(jì)算通過(guò)后端堆棧的熱傳遞,同時(shí)考慮材料屬性。該 AI 模型將設(shè)計(jì)與互連堆棧中的本地功率密度、工作負(fù)載和材料屬性聯(lián)系起來(lái)?!澳隳?GDS 文件,它實(shí)際上會(huì)一起計(jì)算多個(gè)級(jí)別和多個(gè)層的平均屬性,這樣你就可以在每個(gè)給定位置獲得正確的 [傳熱] 平均屬性?,F(xiàn)在你有辦法計(jì)算每個(gè)瓷磚,而且你可以越來(lái)越細(xì)化它,“Chidambarrao 說(shuō)。
在設(shè)計(jì)階段考慮此類熱因素的重要性怎么強(qiáng)調(diào)都不為過(guò)?!胺庋b和芯片正在相互作用,并且已經(jīng)變得非常緊密耦合,因此這是一個(gè)完整的系統(tǒng)技術(shù)優(yōu)化問(wèn)題,你必須擔(dān)心設(shè)計(jì)中的熱問(wèn)題,”他說(shuō)?!斑@尤其必須發(fā)生在背面電源上,我什至沒有想象到最糟糕的事情——在 3D 芯片上放置背面電源。如果這是你想做的,那么解決方案顯然要嚴(yán)格得多。
背面供電已經(jīng)被設(shè)計(jì)到芯片中?!拔覀冾A(yù)計(jì)明年將首次在產(chǎn)品中實(shí)現(xiàn)背面電源,”imec 的主要技術(shù)人員兼熱建模和特性研發(fā)團(tuán)隊(duì)負(fù)責(zé)人 Herman Oprins 說(shuō)?!半m然背面電源最初是無(wú)源結(jié)構(gòu),但進(jìn)一步這也將用于包括信號(hào)時(shí)鐘和其他功能。方法有很多種,但最重要的是你需要通過(guò) nanoTSV 連接正面和背面。
NanoTSV 要求將硅減薄到至少 300nm,可能小于 100nm。此外,還需要進(jìn)行詳細(xì)的建模來(lái)了解此類設(shè)備的冷卻需求。
Oprins 說(shuō):“如果你有一個(gè)局部熱點(diǎn)和超薄硅,你的溫度實(shí)際上會(huì)升高,因?yàn)槟阌懈俚碾娏浚ü瑁﹣?lái)分散它。另一方面,背面有金屬堆棧,因此這種密集的金屬陣列可能有助于設(shè)備的熱量擴(kuò)散。
Imec 之前表明,實(shí)施背面電源會(huì)造成 10% 到 30% 的熱損失 (ECTC 2024)。今年,Oprins 的小組使用 BSPDN 模擬了堆疊邏輯對(duì)內(nèi)存或內(nèi)存對(duì)邏輯的熱效應(yīng)。這些仿真包括芯片的面對(duì)面混合鍵合和背對(duì)面鍵合,結(jié)合使用玻爾茲曼傳輸方程和蒙特卡洛仿真。仿真說(shuō)明了均勻芯片加熱與熱點(diǎn)影響之間的溫升差異(見圖 7)。
圖 7:具有均勻器件加熱(左)的器件溫度升高與有額外熱點(diǎn)的器件。來(lái)源:IEEE ECTC [7]
“堆棧中邏輯和內(nèi)存芯片的順序?qū)嵝阅艿挠绊懜螅監(jiān)prins 說(shuō)?!坝捎诳拷鋮s,Logic-on-top 導(dǎo)致邏輯溫度較低,但由于堆棧中的高熱耦合,內(nèi)存溫度較高?!倍鄬?memory-on-logic 表明,BSPDN 的熱影響減少了多個(gè)芯片堆疊。在這種情況下, logic on top configuration 受 memory die temperature 的熱限制,而對(duì)于 memory-on-top configuration,logic temperature 是限制因素。該論文總結(jié)道:“更高效的冷卻表明,3D SoC BSPDN 的熱性能得到了顯著改善,從而實(shí)現(xiàn)了具有校準(zhǔn)功耗的內(nèi)存邏輯配置。[7]
Oprins 強(qiáng)調(diào)了液體冷卻的重要性。Oprins 說(shuō):“看看 3D 架構(gòu),如果你每個(gè)芯片堆疊 5 個(gè)芯片,比如說(shuō)耗散 100 瓦并使用傳統(tǒng)的空氣冷卻,那么你最終得到的最大結(jié)溫遠(yuǎn)大于 500°C。如果集成冷板,則最高結(jié)溫約為 250°C。 然而,如果你能以某種方式在電堆內(nèi)開發(fā)層間冷卻,那么突然之間就有機(jī)會(huì)真正將溫度降低到 50°C 左右,“imec 的 3D 電堆模擬說(shuō)。
共封裝光學(xué)器件
行業(yè)對(duì)更快數(shù)據(jù)網(wǎng)絡(luò)和設(shè)備接口速度的需求正在急劇增加。數(shù)據(jù)中心機(jī)架內(nèi)部的一個(gè)關(guān)鍵推動(dòng)因素是將光學(xué)引擎與 GPU 和 HBM 集成到同一個(gè)封裝中。“借助共封裝光學(xué)器件 (CPO),我們有機(jī)會(huì)將電氣互連與光學(xué)連接集成到一個(gè)封裝中,”ASE 研究員 CP Hung 說(shuō)。“這是該行業(yè)的新里程碑。通過(guò)將光學(xué)引擎移到更靠近處理器的位置,我們將每根光纖的 200 Gb/s 提高到 6.4Tb/s,帶寬增加了 32 倍。
盡管 CPO 做出了承諾,但未知數(shù)仍然存在?!癈PO 肯定會(huì)發(fā)生,而且這種勢(shì)頭肯定會(huì)推動(dòng)它盡早發(fā)生,”ASE 工程、營(yíng)銷和技術(shù)推廣高級(jí)總監(jiān) Mark Gerber 說(shuō)?!笆褂?CPO 時(shí),熱側(cè)和翹曲側(cè)都存在敏感性。重要的是,該行業(yè)希望保持當(dāng)今存在的光學(xué)引擎的可插拔(即可替換)方面。但是,雖然 plug-able 很容易切換,但它們并不容易掌握。
在 ECTC 上,ASE 展示了其用于 ASIC 交換機(jī)和以太網(wǎng)/HBM 共封裝光學(xué)平臺(tái)的模塊化平臺(tái)。
熱仿真在選擇先進(jìn)封裝散熱堆棧的架構(gòu)、工藝和材料方面也發(fā)揮著關(guān)鍵作用?!皬臍v史上看,在單片芯片集成中,封裝設(shè)計(jì)和散熱器的熱仿真是按照通過(guò)/不通過(guò)的方式進(jìn)行的,”Amkor Technology 的熱仿真工程師 Tom Nordstog 說(shuō)。借助多小芯片封裝,仿真在封裝設(shè)計(jì)的早期階段發(fā)揮著更明顯的作用?!盁岱抡媸且豁?xiàng)風(fēng)險(xiǎn)/回報(bào)練習(xí),旨在選擇最終設(shè)計(jì)。理想情況下,封裝的熱設(shè)計(jì)發(fā)生在芯片設(shè)計(jì)之前。我們看到最積極的客戶在這些早期階段就采用熱仿真。
康寧和Fraunhofer IZM提出了一種可擴(kuò)展的“平面2D波導(dǎo)電路',可以通過(guò)減少對(duì)光纖電纜終端和手動(dòng)組裝的需求,為未來(lái)幾代CPO解決方案減少所需的空間、復(fù)雜性和成本。[8]該團(tuán)隊(duì)使用 460 x 303 毫米熔融成型玻璃面板制造了具有波導(dǎo)布局的單模板級(jí)互連,旨在滿足將 1024 個(gè)光鏈路從面板連接到 CPO 模塊的光互連要求,用于 102.4 Tb/s 數(shù)據(jù)中心交換機(jī)應(yīng)用。Fraunhofer IZM 工程師設(shè)計(jì)了工藝流程(見圖 8),其中包括將單模波導(dǎo)集成到玻璃中的熱離子交換工藝,與 1310nm 波長(zhǎng)的單模光纖的光模式相匹配。移除掩模后,執(zhí)行第二個(gè)反向離子交換過(guò)程步驟,將波導(dǎo)的核心埋在玻璃表面以下,以減少傳播損耗。
Brusberg 說(shuō):“為了與玻璃波導(dǎo)面板的光纖連接,組裝了 MPO-16 適配器,并將玻璃波導(dǎo)電路集成到 1U 機(jī)架機(jī)箱中,以展示僅 0.7 mm 的扁平外形。這種新穎的方法可以為基于 PCB 的光收發(fā)器鋪平道路。
圖 8:工藝流程包括金屬沉積、光刻膠涂層、波導(dǎo)成像和離子交換,以將銀擴(kuò)散到圖案中。來(lái)源:IEEE ECTC [8]
引用
Y-J Lien,“集成在 CoWoS 平臺(tái)上的直接到硅液體冷卻”,IEEE 電子元件和技術(shù)會(huì)議,2025 年 5 月,正在出版。
Yan 等人,“面向 3D IC 的 TSV 兼容微流體冷卻”,IEEE Transactions on Components, Packaging and Manufacturing Technology,第 15 卷,第 1 期,第 104-1,12 頁(yè),2025 年 1 月,doi:10.1109/TCPMT.2024.3516653。
D. Mun 等人,“一種增強(qiáng)散熱的移動(dòng)應(yīng)用中設(shè)備端 AI 的新型架構(gòu)”,IEEE 電子元件和技術(shù)會(huì)議,2025 年 5 月,正在出版。
-H. Lee 等人,“通過(guò)可轉(zhuǎn)移銅/聚合物混合鍵合實(shí)現(xiàn)具有新穎結(jié)構(gòu)的分層多層和堆疊通孔,用于高速數(shù)字應(yīng)用”,IEEE 電子元件和技術(shù)會(huì)議,2025 年 5 月,正在印刷中
Chang 等人,“先進(jìn) BEOL 堆棧等效熱特性的熱建模和分析”,IEEE Transactions on Components, Packaging and Manufacturing Technology,doi:10.1109/TCPMT.2025.3564833。
Elsherbini等人,“通過(guò)低于1um間距的混合鍵合和先進(jìn)的硅載體技術(shù)實(shí)現(xiàn)的Mid-BEOL異構(gòu)集成,用于AI和計(jì)算應(yīng)用”,IEEE電子元件和技術(shù)會(huì)議,2025年5月,正在出版。
R. Chowdhury,“Backside Power Delivery and Chiplet Architectures中后端線熱阻的快速準(zhǔn)確機(jī)器學(xué)習(xí)預(yù)測(cè)”,IEEE 電子元件和技術(shù)會(huì)議,2025 年 5 月,正在出版。
Brusberg,“用于面板和共封裝光收發(fā)器之間板級(jí)光互連的大規(guī)模玻璃波導(dǎo)電路”,IEEE 電子元件和技術(shù)會(huì)議,2025 年 5 月,正在出版。
評(píng)論