展會(huì)信息港展會(huì)大全

Deepseek引領(lǐng)算力競賽下半場,封裝技術(shù)如何改寫AI芯片游戲規(guī)則
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-03-20 09:33:50   瀏覽:100次  

導(dǎo)讀:2025年,以 ChatGPT 為起點(diǎn),生成式 AI 掀起了全球技術(shù)革命,將人工智能的發(fā)展推向了新的高潮。而今年春節(jié)中國科技企業(yè) DeepSeek 推出的千億參數(shù)大模型橫空出世,迅速在全球范圍內(nèi)獲得了廣泛關(guān)注和應(yīng)用,其 APP 上線一個(gè)月下載量便破 1 億,展示出了強(qiáng)大的影響力。在自然語言處理領(lǐng)域,DeepSeek 能夠理解和生成自然語言,實(shí)現(xiàn)人機(jī)對(duì)話、文本生成、機(jī)器翻譯等功能。在與用戶的對(duì) ......

2025年,以 ChatGPT 為起點(diǎn),生成式 AI 掀起了全球技術(shù)革命,將人工智能的發(fā)展推向了新的高潮。而今年春節(jié)中國科技企業(yè) DeepSeek 推出的千億參數(shù)大模型橫空出世,迅速在全球范圍內(nèi)獲得了廣泛關(guān)注和應(yīng)用,其 APP 上線一個(gè)月下載量便破 1 億,展示出了強(qiáng)大的影響力。

在自然語言處理領(lǐng)域,DeepSeek 能夠理解和生成自然語言,實(shí)現(xiàn)人機(jī)對(duì)話、文本生成、機(jī)器翻譯等功能。在與用戶的對(duì)話中,它能夠準(zhǔn)確理解用戶的意圖,并給出富有邏輯和深度的回答,甚至在某些任務(wù)上超越了被譽(yù)為 “最強(qiáng)推理模型” 的 OpenAI GPT 系列模型,其強(qiáng)大的推理能力和語言生成質(zhì)量贏得了廣泛的認(rèn)可。在圖像生成領(lǐng)域,DeepSeek 可以根據(jù)用戶的描述生成高質(zhì)量的圖像,為設(shè)計(jì)、藝術(shù)創(chuàng)作等領(lǐng)域提供了新的工具和思路。

DeepSeek 的成功,離不開其背后強(qiáng)大的算力支持。盡管DeepSeek開辟了全新的技術(shù)路徑,對(duì)算力的需求遠(yuǎn)小于以往的ChatGPT等模型,然而訓(xùn)練和運(yùn)行這樣的大模型,仍然需要消耗天文數(shù)字級(jí)的算力,單次訓(xùn)練需調(diào)用數(shù)萬張 GPU,每秒處理超萬億次浮點(diǎn)運(yùn)算。在摩爾定律逐漸逼近極限的當(dāng)下,面對(duì)如此龐大的算力需求,AI芯片在內(nèi)存帶寬、芯片互聯(lián)效率等方面面臨著極致的挑戰(zhàn),先進(jìn)封裝技術(shù)作為實(shí)現(xiàn)這些高性能AI芯片的關(guān)鍵手段,其重要性愈發(fā)凸顯。

超算與數(shù)據(jù)中心:AI 算力的基石

在生成式 AI 的發(fā)展進(jìn)程中,超算和數(shù)據(jù)中心扮演著舉足輕重的角色,是 AI 算力的核心基石。超算和數(shù)據(jù)中心作為 AI 計(jì)算的核心基礎(chǔ)設(shè)施,承擔(dān)著巨大的算力任務(wù)。超算主要針對(duì)大規(guī)模、高復(fù)雜度的計(jì)算任務(wù),如深度學(xué)習(xí)模型的訓(xùn)練;而數(shù)據(jù)中心則側(cè)重于大規(guī)模數(shù)據(jù)的處理和存儲(chǔ),支持模型的推理和應(yīng)用。

為了滿足這些需求,超算和數(shù)據(jù)中心需要配備高性能的芯片和先進(jìn)的封裝技術(shù),以實(shí)現(xiàn)高效的數(shù)據(jù)處理和傳輸。

在構(gòu)建支持大規(guī)模AI算力的超算和數(shù)據(jù)中心時(shí),最為核心的高性能計(jì)算芯片、互聯(lián)和存儲(chǔ)芯片及其這些芯片的封裝技術(shù)的選擇尤為關(guān)鍵:

-GPU(圖形處理器)

GPU 是 AI 計(jì)算的核心芯片之一,擅長處理大規(guī)模的并行計(jì)算任務(wù),如深度學(xué)習(xí)中的矩陣運(yùn)算。NVIDIA 的 A100 和 H100 芯片是目前廣泛使用的高性能 GPU。

封裝類型:通常采用先進(jìn)的 2.5D 封裝技術(shù),如臺(tái)積電的 CoWoS(Chip on Wafer on Substrate)封裝工藝。這種封裝通過硅中介層(interposer)將多個(gè)芯片整合在一起,提高了芯片之間的數(shù)據(jù)傳輸效率。

-CPU(中央處理器)

CPU 是數(shù)據(jù)中心的基礎(chǔ)芯片,負(fù)責(zé)處理通用計(jì)算任務(wù)和控制數(shù)據(jù)流。在 AI 計(jì)算中,CPU 通常與 GPU 或 ASIC 等加速芯片協(xié)同工作。

封裝類型:現(xiàn)代 CPU 芯片通常采用 LGA(Land Grid Array)或 PGA(Pin Grid Array)封裝類型。這些封裝類型具有高密度的引腳布局,能夠提供良好的電氣性能和散熱性能。

-ASIC(專用集成電路)

ASIC 是為特定應(yīng)用設(shè)計(jì)的芯片,如谷歌的 TPU(Tensor Processing Unit)和寒武紀(jì)的思元系列芯片等,專門用于加速深度學(xué)習(xí)中的特定計(jì)算任務(wù)。

封裝類型:常見的有 BGA(Ball Grid Array)和 FC-BGA(Flip Chip Ball Grid Array)等。這些封裝類型具有高密度、高性能的特點(diǎn),能夠滿足 ASIC 芯片在 AI 計(jì)算中的高性能需求。

-FPGA(現(xiàn)場可編程門陣列)

FPGA 是一種可編程的硬件芯片,可以通過編程實(shí)現(xiàn)不同的功能,適用于 AI 推理中的靈活配置和優(yōu)化。

封裝類型:通常采用 BGA 封裝,這種封裝類型具有良好的散熱性能和高密度的引腳布局,能夠支持 FPGA 在 AI 計(jì)算中的高效運(yùn)行。

-光模塊

光模塊是數(shù)據(jù)中心中用于高速數(shù)據(jù)傳輸?shù)年P(guān)鍵組件,特別是在 AI 計(jì)算中,光模塊能夠提供高帶寬、低延遲的數(shù)據(jù)傳輸。

封裝類型:常見的封裝類型包括 SFP(Small Form-factor Pluggable)、QSFP(Quad Small Form-factor Pluggable)等。這些封裝類型具有小型化、高密度的特點(diǎn),能夠滿足數(shù)據(jù)中心對(duì)空間和性能的雙重需求。

-HBM(高帶寬內(nèi)存)

HBM 是一種新型的內(nèi)存技術(shù),因其高數(shù)據(jù)傳輸速率和低功耗特點(diǎn),廣泛應(yīng)用于圖形處理單元(GPU)、深度學(xué)習(xí)加速器和高性能計(jì)算(HPC)等領(lǐng)域。HBM 允許芯片以更高的速度處理數(shù)據(jù),這對(duì)于當(dāng)今數(shù)據(jù)暴增的時(shí)代顯得尤為重要。

封裝技術(shù):HBM 通常采用先進(jìn)的 3D 堆疊技術(shù),通過硅通孔(TSV)技術(shù)將多個(gè) DRAM 芯片垂直堆疊在一起,結(jié)合 2.5D 先進(jìn)封裝,實(shí)現(xiàn)高帶寬、高容量與低功耗特性。

這些芯片在超算和數(shù)據(jù)中心中協(xié)同工作,共同為生成式 AI 提供強(qiáng)大的算力支持。GPU 負(fù)責(zé)處理大規(guī)模的并行計(jì)算任務(wù),ASIC 專注于特定算法的高效執(zhí)行,F(xiàn)PGA 提供了靈活的定制化能力,而 CPU 則負(fù)責(zé)整體的控制和協(xié)調(diào)。它們的有機(jī)結(jié)合,使得超算和數(shù)據(jù)中心能夠滿足生成式 AI 對(duì)算力的極高要求,推動(dòng) AI 技術(shù)的不斷發(fā)展和創(chuàng)新。

除此之外,同時(shí)隨著算力需求的激增,超算與數(shù)據(jù)中心的核心硬件架構(gòu)正在發(fā)生根本性變革。

首先是芯片類型,正從單一GPU到異構(gòu)集成:

Chiplet(芯粒):將大算力芯片拆分為多個(gè)功能模塊(如計(jì)算單元、存儲(chǔ)、I/O),通過先進(jìn)封裝重新集成,提升良率與靈活性。例如,AMD MI300X通過13顆Chiplet集成,算力較前代提升3倍。

高帶寬內(nèi)存(HBM):HBM3堆疊內(nèi)存可提供超過1TB/s的帶寬,成為大模型訓(xùn)練標(biāo)配。但其高達(dá)12層的垂直堆疊,對(duì)封裝精度提出嚴(yán)苛要求。

其次,先進(jìn)封裝扮演越來越重要的角色,2.5D/3D架構(gòu)成破局關(guān)鍵:

CoWoS(Chip-on-Wafer-on-Substrate):臺(tái)積電的2.5D封裝方案,通過硅中介層連接GPU與HBM,互連密度提升10倍,成為NVIDIA H100等AI芯片的“心臟”。如今業(yè)內(nèi)還在開發(fā)更高密度的芯片垂直互連,例如臺(tái)積電的3D SoIC等。

混合鍵合(Hybrid Bonding):直接以銅-銅鍵合替代傳統(tǒng)焊料,將互連間距縮至微米級(jí),突破散熱與信號(hào)延遲瓶頸,被視作3D封裝終極方案。

不難看出,在超算和數(shù)據(jù)中心中,為了充分發(fā)揮各類芯片的性能優(yōu)勢,滿足 AI 算力對(duì)芯片性能、散熱和集成度的嚴(yán)格要求, AI算力芯片通常采用先進(jìn)的封裝類型,如BGA、FC-BGA、LGA、PGA、SFP、QSFP、SiP、SoC等。BGA封裝通過底部的球形金屬焊盤實(shí)現(xiàn)芯片與PCB的連接,具有高引腳密度和良好的電氣性能。FC-BGA封裝則通過倒裝芯片技術(shù)進(jìn)一步提高了I/O密度和電性性能,同時(shí)降低了電磁干擾。LGA封裝適用于高性能處理器,具有高引腳密度和良好的散熱性能。PGA封裝則以其可靠的連接性能和高頻率適應(yīng)性被廣泛應(yīng)用于微處理器領(lǐng)域。SFP和QSFP封裝主要用于光通信模塊,支持高速數(shù)據(jù)傳輸。SiP將多個(gè)具有不同功能的有源電子元件與可選無源器等通過并排或疊加的方式集成在一個(gè)封裝內(nèi),實(shí)現(xiàn)一定功能的單個(gè)標(biāo)準(zhǔn)封裝件,形成一個(gè)(子)系統(tǒng)。該方案的集成度相對(duì)較低,但可以更加務(wù)實(shí)地滿足包括模擬/RF器件以及電源管理器等方面的市場需求。SoC是一種將系統(tǒng)所需的全部組件(如數(shù)據(jù)處理單元、嵌入式存儲(chǔ)器等)壓縮到同一個(gè)芯片上的集成電路,需要2.5D、3D集成以及多芯片模塊等先進(jìn)封裝技術(shù)的支持。作為按照摩爾定律繼續(xù)往下發(fā)展并追求極高集成度的方案,SoC在人工智能和高性能計(jì)算等領(lǐng)域不可或缺。

這些封裝技術(shù)在提升芯片性能和可靠性方面起著至關(guān)重要的作用,通過優(yōu)化封裝設(shè)計(jì),可以有效提高芯片的散熱性能,確保其在高負(fù)荷運(yùn)行下的穩(wěn)定性和壽命。同時(shí),先進(jìn)的封裝技術(shù)能夠增加芯片的集成度,減少占用空間,從而在有限的超算和數(shù)據(jù)中心空間內(nèi)實(shí)現(xiàn)更高的算力密度。這些技術(shù)進(jìn)步直接推動(dòng)了AI算力的提升,使得更大規(guī)模、更復(fù)雜的AI模型得以高效訓(xùn)練和部署。

奧芯明:封裝技術(shù)先鋒,算力革命的“中國答案”

算力瓶頸的本質(zhì),是芯片性能與封裝技術(shù)的雙重挑戰(zhàn):超算需求方面,生成式AI依賴分布式計(jì)算集群,要求芯片間通信延遲低至納秒級(jí);能效焦慮方面,訓(xùn)練單次模型的碳排放堪比數(shù)百輛汽車全年排放,需通過芯片設(shè)計(jì)優(yōu)化與封裝創(chuàng)新降低功耗;成本壓力方面,大模型商業(yè)化落地要求單位算力成本下降,而傳統(tǒng)芯片架構(gòu)已逼近物理極限。

因此,這場算力革命,正在倒逼半導(dǎo)體產(chǎn)業(yè)從“制程微縮”轉(zhuǎn)向“封裝創(chuàng)新”。行業(yè)內(nèi)已有共識(shí),封裝技術(shù)對(duì)芯片性能的影響已超過30%,成為AI算力競賽的核心戰(zhàn)場,這也對(duì)封裝設(shè)備提出了前所未有的挑戰(zhàn)和新的需求。在性能、精度、效率等關(guān)鍵方面,封裝設(shè)備正經(jīng)歷著深刻的變革,以適應(yīng)生成式 AI 時(shí)代的要求。

性能方面,生成式 AI 需要處理海量的數(shù)據(jù)和復(fù)雜的計(jì)算任務(wù),這就要求芯片具備更高的性能。為了滿足這一需求,封裝設(shè)備需要能夠支持更高密度的芯片集成,實(shí)現(xiàn)芯片之間更高速、更穩(wěn)定的信號(hào)傳輸。例如,在先進(jìn)的 2.5D 和 3D 封裝技術(shù)中,封裝設(shè)備需要具備高精度的對(duì)準(zhǔn)和鍵合能力,以確保芯片之間的互連精度和可靠性。

精度方面,隨著芯片集成度的不斷提高,對(duì)封裝精度的要求也越來越高。封裝設(shè)備需要具備亞微米級(jí)甚至納米級(jí)的精度,以確保芯片在封裝過程中的位置準(zhǔn)確性和互連質(zhì)量。例如,在倒裝芯片封裝中,封裝設(shè)備需要將芯片上的微小焊點(diǎn)與基板上的焊盤精確對(duì)準(zhǔn),實(shí)現(xiàn)可靠的電氣連接。如果封裝精度不足,可能會(huì)導(dǎo)致焊點(diǎn)虛焊、短路等問題,嚴(yán)重影響芯片的性能和可靠性。為了實(shí)現(xiàn)高精度的封裝,封裝設(shè)備采用了先進(jìn)的視覺識(shí)別、運(yùn)動(dòng)控制和微機(jī)電系統(tǒng)(MEMS)等技術(shù),能夠?qū)π酒突暹M(jìn)行精確的定位和操作。

效率方面,面對(duì)生成式 AI 市場對(duì)芯片的巨大需求,封裝設(shè)備需要具備更高的生產(chǎn)效率,以滿足大規(guī)模生產(chǎn)的要求。這就要求封裝設(shè)備能夠?qū)崿F(xiàn)自動(dòng)化、智能化的生產(chǎn)流程,減少人工干預(yù),提高生產(chǎn)速度和一致性。一些先進(jìn)的封裝設(shè)備采用了機(jī)器人自動(dòng)化技術(shù),能夠?qū)崿F(xiàn)芯片的自動(dòng)上料、定位、封裝和檢測等全過程的自動(dòng)化操作,大大提高了生產(chǎn)效率和產(chǎn)品質(zhì)量。同時(shí),通過引入人工智能和機(jī)器學(xué)習(xí)算法,封裝設(shè)備還能夠?qū)崿F(xiàn)生產(chǎn)過程的優(yōu)化和故障預(yù)測,進(jìn)一步提高生產(chǎn)效率和設(shè)備的可靠性。

為了適應(yīng)這些新需求,封裝設(shè)備制造商不斷進(jìn)行技術(shù)創(chuàng)新和產(chǎn)品升級(jí)。在這場全新的技術(shù)博弈中,奧芯明作為 ASMPT 在中國市場設(shè)立的獨(dú)立運(yùn)營品牌,致力于提供先進(jìn)封裝設(shè)備與解決方案。奧芯明不僅整合 ASMPT 的全球技術(shù)優(yōu)勢,還結(jié)合本土研發(fā)、供應(yīng)鏈優(yōu)化及行業(yè)定制化能力,為中國市場提供更具適配性的封裝設(shè)備與工藝技術(shù)。

目前,奧芯明提供的解決方案覆蓋了從薄膜沉積、激光開槽切割,到精密電子和光學(xué)元件的成型、組裝、封裝和檢測等一系列環(huán)節(jié),產(chǎn)品組合豐富多樣,可以滿足大規(guī)模生產(chǎn)的需求,并被廣泛應(yīng)用于HPC、AI、光通信、IGBT和新能源等領(lǐng)域。

在人工智能領(lǐng)域,奧芯明依托ASMPT的全球技術(shù)積累,同時(shí)結(jié)合本地工程優(yōu)化與工藝創(chuàng)新,提供熱壓式固晶(TCB)、混合鍵合(HB)等先進(jìn)封裝技術(shù),助力AI算力芯片和高性能計(jì)算的突破。奧芯明在本土設(shè)立研發(fā)團(tuán)隊(duì),與行業(yè)客戶深度合作,優(yōu)化封裝工藝,以適配中國 AI 芯片產(chǎn)業(yè)的特定需求。

公司的熱壓式固晶廣泛應(yīng)用于各種先進(jìn)邏輯以及存儲(chǔ)芯片;混合鍵合式固晶(HB)從早期的CIS和3D NAND堆疊等應(yīng)用的晶圓到晶圓混合鍵合,到現(xiàn)在最新die to wafer的HPC和數(shù)據(jù)中心的邏輯芯片異質(zhì)集成以及存儲(chǔ)器的3D堆疊;Fan-out固晶適用于2.5D、扇出和嵌入式應(yīng)用;覆晶(FC)高精度固晶亦在AI算力芯片占據(jù)一定的市場。

通過提供卓越的一站式封裝解決方案,奧芯明正在助力客戶在高性能計(jì)算領(lǐng)域取得更大的突破和創(chuàng)新。例如:

-熱壓鍵合機(jī)(TCB Bonders)

作為AI及其服務(wù)器中最高端邏輯芯片組裝的關(guān)鍵技術(shù),奧芯明的熱壓鍵合(TCB)從芯片到基板(C2S)、芯片到晶圓(C2W)逐步進(jìn)化,現(xiàn)已成為超精密、高吞吐量的可擴(kuò)展解決方案。它能夠滿足未來行業(yè)需求,提升集成度和效率,增強(qiáng)芯片整體的性能。

ASMPT是全球首家開創(chuàng)具有惰性氣體保護(hù)環(huán)境的TCB機(jī)臺(tái)的公司,奧芯明的 TCB 設(shè)備基于 ASMPT 在惰性氣體保護(hù)環(huán)境技術(shù)上的全球領(lǐng)先經(jīng)驗(yàn),并針對(duì)中國封測市場的實(shí)際需求進(jìn)行了優(yōu)化。通過在所有 TCB 機(jī)臺(tái)上配置氮?dú)獗Wo(hù),奧芯明進(jìn)一步提升了鍵合的穩(wěn)定性與封裝可靠性,為 HPC 和 AI 芯片制造提供高精度、高一致性的封裝工藝。

-無助焊劑熱壓鍵合(Fluxless TCB)技術(shù):

在先進(jìn)封裝的互連密度不斷提升的趨勢下, ASMPT 率先推出 fluxless TCB 技術(shù),并在全球范圍內(nèi)廣泛應(yīng)用。奧芯明基于這一技術(shù)突破,結(jié)合中國封測行業(yè)的需求,對(duì)其工藝進(jìn)行了本地優(yōu)化,提供更高效的封裝方案,進(jìn)一步幫助客戶可以通過TCB鍵合提升產(chǎn)品互聯(lián)密度并且降低成本,同時(shí)該技術(shù)支持30微米甚至更薄的芯片封裝,適用于 HBM(高帶寬存儲(chǔ))堆疊,并能大幅提高封裝良率。

Firebird 系列機(jī)型主要針對(duì)先進(jìn)TCB技術(shù)應(yīng)用,主要機(jī)型包括FB-SW、FB-XD、FB-XHI等,可以處理不同的產(chǎn)品以及要求。

-HBM封裝技術(shù)

HBM作為一種新型的內(nèi)存技術(shù),因其高數(shù)據(jù)傳輸速率和低功耗特點(diǎn),廣泛應(yīng)用于圖形處理單元(GPU)、深度學(xué)習(xí)加速器和高性能計(jì)算(HPC)等領(lǐng)域。HBM允許芯片以更高的速度處理數(shù)據(jù),這在當(dāng)今數(shù)據(jù)暴增的時(shí)代顯得尤為重要。

針對(duì)這一市場需求,奧芯明依托ASMPT的技術(shù)積累提供的FB-XHI熱壓鍵合機(jī),結(jié)合flux less TCB技術(shù)能夠有效提升HBM模塊的生產(chǎn)效率和良率,通過精確的溫度控制和精細(xì)的焊接工藝,確保多層芯片之間的連接質(zhì)量。通過將多層DRAM芯片封裝在一起,HBM顯著提升了存儲(chǔ)性能和容量,優(yōu)化能效,為AI和大數(shù)據(jù)處理提供了強(qiáng)有力的支持。

結(jié)語

盡管DeepSeek通過算法層三大突破低秩鍵值壓縮、動(dòng)態(tài)稀疏MoE架構(gòu)及GRPO強(qiáng)化學(xué)習(xí)框架,顯著降低千億參數(shù)模型的推理延遲與算力需求,其API成本僅為OpenAI同級(jí)別模型的千分之一,但是AI芯片性能的瓶頸仍將催生先進(jìn)封裝技術(shù)加速突破,進(jìn)而帶動(dòng)上游先進(jìn)封裝及封裝設(shè)備的需求攀升。

從Deepseek大模型的驚艷亮相,到幕后的奧芯明在封裝技術(shù)的默默深耕,中國科技企業(yè)正在兩條戰(zhàn)線上同步突破:一面以算法創(chuàng)新定義應(yīng)用場景,一面以硬核技術(shù)夯實(shí)算力底座。在這場生成式AI驅(qū)動(dòng)的變革中,奧芯明不僅是先進(jìn)封裝設(shè)備的供應(yīng)商,更是中國半導(dǎo)體產(chǎn)業(yè)從“跟隨”到“引領(lǐng)”的關(guān)鍵支點(diǎn)。

可以預(yù)見,新人工智能經(jīng)濟(jì)即將到來,而生成式AI的爆發(fā)僅是起點(diǎn),隨著量子計(jì)算、腦機(jī)接口等技術(shù)的演進(jìn),算力需求將呈指數(shù)級(jí)增長。這將帶動(dòng)半導(dǎo)體需求的增長,并加速先進(jìn)封裝技術(shù)的發(fā)展。面對(duì)這一趨勢,奧芯明的技術(shù)布局,正為這場持久戰(zhàn)儲(chǔ)備關(guān)鍵彈藥,公司將繼續(xù)專注于下一代先進(jìn)集成封裝技術(shù),如HI/SiP、硅光子學(xué)(SiPh)和共封裝光學(xué)(CPO)等,積極探索其在生成式 AI 領(lǐng)域的應(yīng)用,為AI芯片性能釋放構(gòu)建堅(jiān)實(shí)底座。

贊助本站

相關(guān)熱詞: ai芯片 DeepSeek 集成電路 算力 封裝

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港