NVIDIA於2025年12月宣布延攬前Google TPU開發者Jonathan Ross,並與Jonathan Ross創辦的新創公司Groq簽署合作協議,背後的目的就是希冀將Groq的大型語言模型推論加速技術LPU納入NVIDIA的技術組合;根據GPU技術專家AGF在個人X指稱,NVIDIA預計在2028年公布的下一代加速器Feyman整合Grog的LPU,並透過3D封裝添加快取,使Feyman在執行推論任務時能夠進一步提升性能。
AGF的論點是由於考量到先進製程成本高昂,但採先進製程的SRAM快取並沒有因此明顯縮減單位面積,倘若要直接在預計使用台積電16nm製程的Feyman單晶片設計加入SRAM效益不高,同時會影響成本與設計複雜性,最合理的最法就是利用更成熟、成本合宜的製程生產獨立的SRAM模組,利用類似AMD的X3D快取封裝方式為Feyman增添更大的快取,結合HBM的大容量與SRAM快取的低延遲,進一步封殺其它客製化SAIC挑戰NVIDIA當前AI霸業的可能性。
▲NVIDIA將透過整合LPU遏止客製化ASIC趁虛而入,進一步鞏固在AI領域的領菸
不過對於NVIDIA與台積電而言,無論是在GPU整合LPU或是結合3D快取都是新挑戰,在相當複雜的先進GPU AI晶片設計額外加入針對大型語言模型加速的LPU,需要在兩種不同的架構需求取得平衡,此外原本高階AI晶片就會產生龐大的發熱,再加上3D封裝快取後該如何使晶片具備可靠的散熱又是另一個挑戰,然而對於NVIDIA而言,若要進一步維持在AI領域的全方位優勢、避免ASIC趁虛而入,就需要解決整合LPU與擴增快取的挑戰。
![[直播] 今日加密新聞:2025 年 12 月 29 日最新動態 – Bitcoin 突破 90,000 美元,加密貨幣全面反彈帶動 SocialFi 及主要山寨幣上漲](https://static.coinstats.app/news/source/1716914275457.png)

