交易所DEX+

NVIDIA於2025年12月宣布延攬前Google TPU開發者Jonathan Ross，並與Jonathan Ross創辦的新創公司Groq簽署合作協議，背後的目的就是希冀將Groq的大型語言模型推論加速技術LPU納入NVIDIA的技術組合；根據GPU技術專家AGF在個人X指稱，NVIDIA預計在2028年公布的NVIDIA於2025年12月宣布延攬前Google TPU開發者Jonathan Ross，並與Jonathan Ross創辦的新創公司Groq簽署合作協議，背後的目的就是希冀將Groq的大型語言模型推論加速技術LPU納入NVIDIA的技術組合；根據GPU技術專家AGF在個人X指稱，NVIDIA預計在2028年公布的

預計在2028年公布的NVIDIA Feynman可能整合Grog LPU並採用3D堆疊快取

作者：Cool3c

來源：Cool3c

2025/12/29 11:08

NVIDIA於2025年12月宣布延攬前Google TPU開發者Jonathan Ross，並與Jonathan Ross創辦的新創公司Groq簽署合作協議，背後的目的就是希冀將Groq的大型語言模型推論加速技術LPU納入NVIDIA的技術組合；根據GPU技術專家AGF在個人X指稱，NVIDIA預計在2028年公布的下一代加速器Feyman整合Grog的LPU，並透過3D封裝添加快取，使Feyman在執行推論任務時能夠進一步提升性能。

AGF的論點是由於考量到先進製程成本高昂，但採先進製程的SRAM快取並沒有因此明顯縮減單位面積，倘若要直接在預計使用台積電16nm製程的Feyman單晶片設計加入SRAM效益不高，同時會影響成本與設計複雜性，最合理的最法就是利用更成熟、成本合宜的製程生產獨立的SRAM模組，利用類似AMD的X3D快取封裝方式為Feyman增添更大的快取，結合HBM的大容量與SRAM快取的低延遲，進一步封殺其它客製化SAIC挑戰NVIDIA當前AI霸業的可能性。

▲NVIDIA將透過整合LPU遏止客製化ASIC趁虛而入，進一步鞏固在AI領域的領菸

不過對於NVIDIA與台積電而言，無論是在GPU整合LPU或是結合3D快取都是新挑戰，在相當複雜的先進GPU AI晶片設計額外加入針對大型語言模型加速的LPU，需要在兩種不同的架構需求取得平衡，此外原本高階AI晶片就會產生龐大的發熱，再加上3D封裝快取後該如何使晶片具備可靠的散熱又是另一個挑戰，然而對於NVIDIA而言，若要進一步維持在AI領域的全方位優勢、避免ASIC趁虛而入，就需要解決整合LPU與擴增快取的挑戰。

免責聲明: 本網站轉載的文章均來源於公開平台，僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利，請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證，並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考，不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。