_英特爾AI芯片Gaudi 3登場(chǎng)-網(wǎng)絡(luò )廣播系統|IP廣播|數字廣播|數字網(wǎng)絡(luò )廣播|智能廣播|校園廣播生產(chǎn)廠(chǎng)家-南京凱熙電子

公司動(dòng)態(tài)

原標題：
英特爾AI芯片Gaudi 3登場(chǎng)，狠挖英偉達墻腳

轉載：
https://www.163.com/dy/article/IVFVAFQM05118O92.html

英偉達如今在 AI 芯片市場(chǎng)的地位無(wú)可爭議，直線(xiàn)上漲的數據中心收入和市值就是最好的佐證。但王權沒(méi)有永恒，英偉達并非不可撼動(dòng)。

在英偉達發(fā)布最新一代 BlackWell GPU 的三周后，4 月 9 日晚，英特爾在 Vision 2024 大會(huì )上發(fā)布了一系列關(guān)于芯片的大消息。

會(huì )上，英特爾發(fā)布了面向數據中心的第六代至強處理器，也提前展示了面向下一代 AI PC 的 Lunar Lake 處理器。不過(guò)縱觀(guān)整場(chǎng)大會(huì )，英特爾花費最多篇幅也最重視的，可能還是最新一代的 AI 芯片：

英特爾 Gaudi 3。

超越英偉達 H100：Gaudi 3 性能更強、成本更低

Gaudi 3 最直接的升級體現在性能和成本方面。

相比英偉達 H100，Gaudi 3 的人工智能推理性能平均提高 50%，能效平均提高 40%�；鶞蕼y試中，Gaudi 3 可以在 Llama2-7B、Llama2-13B 模型中將訓練時(shí)間縮短到英偉達 H100 的一半，同時(shí)推理吞吐量也比后者平均高出了 50%。

可以說(shuō)，Gaudi 3 至少在 Llama2 等關(guān)鍵大模型中擊敗了基于英偉達 Hopper 架構的 H100 GPU，這也是目前市售產(chǎn)品中技術(shù)最先進(jìn)的 AI 芯片。

而 Gaudi 3 還有另一個(gè)極其重要的升級——比 H100 低得多的成本，按照英特爾的原話(huà)是：

（Gaudi 3 的）成本僅為英偉達 H100 的一小部分。
也怪不得 Gaudi 3 剛剛發(fā)布，英特爾就宣布 Naver（韓國互聯(lián)網(wǎng)巨頭）、博世、IBM、Ola 等一大批公司成為英特爾 Gaudi 加速器的客戶(hù)和合作伙伴。而最早在今年第二季度，英特爾就將向戴爾、惠普以及超微等 OEM 廠(chǎng)商率先供貨，第三季度正式上市。

耐人尋味的是，英特爾往年在 Vision 大會(huì )上基本不會(huì )發(fā)布新的芯片，今年卻一反常態(tài)發(fā)布了六代至強處理器和 Gaudi 3 AI 芯片兩款重磅產(chǎn)品。

考慮到英特爾 CEO 帕特·基辛格（Pat Gesinger）去年底就炮轟過(guò)英偉達的 CUDA 生態(tài)「既淺又窄」，似乎除了軟件生態(tài)上的對抗，英特爾也在加快硬件上的追趕。

不過(guò)，Gaudi 3 真的有機會(huì )挑戰英偉達的 GPU 霸權嗎？

要知道，相比英偉達兩年前基于 Hopper GPU 架構的 H100，上個(gè)月基于 BlackWell GPU 架構發(fā)布的 B100 又進(jìn)行了一輪大幅的升級，包括馬斯克也不禁感慨，「目前沒(méi)有什么比英偉達 GPU 更好的 AI 芯片了�！�

Gaudi 3 硬件追上英偉達了嗎？

不同于 BlackWell 采用了最新的臺積電 3nm 工藝，Gaudi 3 基于臺積電 5nm 工藝打造，同時(shí)張量核心從 24 個(gè)升級到了 32 個(gè)。

相比上一代的 Gaudi 2，Gaudi 3 在 FP8 性能、BF16 性能、網(wǎng)絡(luò )帶寬、內存帶寬都得到了全面的提升，其中 FP8 吞吐量更是高達 1835 TFLOPS：

基本翻了一番。

比較奇怪的是，搭載 128GB 內存的 Gaudi 3 沒(méi)有采用最新的 HBM3（高帶寬內存），而是采用了稍微有點(diǎn)過(guò)時(shí)的 HBM2e。

除了更低的傳輸帶寬，HBM2e 的單顆容量也只有 16GB，相比之下 HBM3 的傳輸帶寬得到了大幅提升，單顆容量也能達到 24GB，甚至是 32GB。

此外，Gaudi 3 采用了英偉達 BlackWell 類(lèi)似的雙芯片設計，同時(shí)封裝了兩個(gè)相同的芯片，并通過(guò)高帶寬鏈路進(jìn)行連接。每個(gè) Gaudi 3 芯片都具有 48MB 板載 SRAM，整個(gè)芯片提供 96MB SRAM，總帶寬為 12.8TB/秒。

I/O 方面，英特爾并沒(méi)有放棄以太網(wǎng)路線(xiàn)，在 Gaudi 3 上將以太網(wǎng)端口的速率從 100GB/s 升級到了 200GB/s，再考慮到雙芯片的設計和每個(gè)芯片 24 個(gè)以太網(wǎng)端口，每一張 Gaudi 3 的以太網(wǎng) I/O 總帶寬高達 8.4TB/s。

總的來(lái)說(shuō)，英特爾在 Gaudi 3 的升級上并不激進(jìn)，甚至可以說(shuō)有些保守，包括成本要低得多的 5nm 工藝和 HBM2e 內存，都說(shuō)明了這一點(diǎn)。雖然相比上一代 Gaudi 2 已經(jīng)有了明顯的進(jìn)步，在部分大模型上超越 H100，但顯然很難與英偉達最新的 B100 相抗衡。

但英特爾的決策未必錯了。

一方面，考慮到英偉達在 AI 加速計算方面的技術(shù)和生態(tài)領(lǐng)先優(yōu)勢，英特爾就算不惜一切代價(jià)進(jìn)行追趕，很可能也難以追平，同時(shí)高昂的芯片成本，還會(huì )導致英特爾直接錯失正在快速增長(cháng)的 AI 芯片市場(chǎng)。

另一方面，在成本優(yōu)勢明顯的前提下，英特爾只要能做到超越英偉達 H100 的表現，自然能夠吸引足夠的客戶(hù)進(jìn)行采購。

更何況就連英偉達自己也預計，「下一代產(chǎn)品（B100）將出現供應緊張」。面對「想買(mǎi)不能買(mǎi)」的窘境，很多客戶(hù)自然而然也會(huì )轉向其他可替代的 AI 芯片。

這其中，就有屬于 Gaudi 3 的機會(huì )。

硬件、軟件生態(tài)齊頭并進(jìn)，英特爾能否扛起大旗？

「整個(gè)行業(yè)都希望能干掉 CUDA，包括 Google、OpenAI 等公司都在想方設法讓人工智能訓練更加開(kāi)放。我們認為 CUDA 的護城河既淺又窄�！够粮裾f(shuō)。

在前不久雷科技的報道中，我們就解析了全球科技巨頭組建 UXL 統一加速基金會(huì )對抗英偉達 CUDA 的動(dòng)作。

簡(jiǎn)單來(lái)說(shuō)，巨頭們基于英特爾 oneAPI 技術(shù)，正在開(kāi)發(fā)一套開(kāi)源軟件平臺來(lái)替代英偉達 CUDA 平臺，允許人工智能開(kāi)發(fā)者在任何 AI 芯片上運行他們的代碼，也包括英偉達 GPU，核心是解除芯片硬件與軟件開(kāi)發(fā)平臺之間的強綁定關(guān)系，打破英偉達 GPU 在開(kāi)發(fā)生態(tài)上的霸權。

正如高通人工智能和機器學(xué)習主管 Vinesh Sukumar 所言：「我們實(shí)際上是在向開(kāi)發(fā)者展示如何從英偉達平臺遷移出來(lái)�！�

軟件的推倒、硬件的追趕，英特爾顯然明白英偉達的成功既來(lái)源于軟件，也來(lái)源于硬件，只有齊頭并進(jìn)才能真正追趕上英偉達的腳步，甚至干掉 CUDA，干掉英偉達的護城河。

但英特爾能不能扛起「打倒英偉達」的大旗，奪回數據中心市場(chǎng)的領(lǐng)先地位？關(guān)鍵可能取決于兩點(diǎn)：

一是英特爾能不能在一眾英偉達挑戰者中脫穎而出，包括 AMD 以及一眾全球 AI 芯片公司都不會(huì )錯過(guò)英偉達 GPU「供不應求」的機會(huì )；

二是按照英特爾的路線(xiàn)圖，在合并 GPU 和 AI 芯片兩條產(chǎn)品線(xiàn)之后，代號「Falcon Shores」的下一代 GPU，能不能展現出超越英偉達最新一代 GPU 的潛力。

過(guò)去一年多，AI 掀起了一場(chǎng)不言而喻的革命，但不管 AI 將如何改變我們的生活，芯片算力依然是底層的驅動(dòng)力。

但英偉達生生占據了 AI 芯片市場(chǎng)的 80%，這顯然并不尋常，不過(guò)人們最不滿(mǎn)的關(guān)鍵其實(shí)還是：英偉達無(wú)法滿(mǎn)足所有人。在這個(gè)前提下，不管是英特爾、AMD 還是國產(chǎn) AI 芯片廠(chǎng)商，其實(shí)都還有機會(huì )。

換言之，英特爾 Gaudi 3 面對的還是一塊「廣闊天地」，自然「大有可為」。

文章來(lái)源于網(wǎng)絡(luò )，如有侵權，請聯(lián)系凱熙電子evapa_cn#126.com刪除！(請將#換成@)

luluse,黄wwwww,亚洲三级网址,日韩美a一级毛片,黄色avav,性欧美在线视频,日韩精品欧美亚洲高清有无