免(miǎn)費(fèi)谘詢熱線(xiàn)
13621929115
www.17C.com(men)一直(zhí)在談論矽光(guāng)子學,以至於www.17C.com可能和你們中的許多人一樣,對它還沒有(yǒu)普及感(gǎn)到沮喪。但好消息是電(diàn)信號的進(jìn)步,在十年前(qián)真正開始討論實用的矽光子互連之後(hòu),繼續發展,www.17C.com還沒有真正不得不求助於矽光子。
由於(yú)組展示道具件之間的(de)電氣(qì)互連成本要低得多,這對價格/性能(néng)等式的價格分子部分來說是(shì)一個福音,盡管矽光子(zǐ)學在(zài)該等式的(de)分母性能部分具有(yǒu)優勢。隨著時間的推移,隨著帶寬的增加,電信號變得越來越短,而且噪音也越來越大。這一天展示道具將不可避免地到(dào)來,www.17C.com將從電子轉向光子(zǐ)作為電磁信(xìn)號方法,從銅(tóng)轉向光纖玻璃(lí)作為信號介質。
這條(tiáo)曲線來自 Nvidia (英偉達(dá))首席科學家 Bill Dally 在 3 月份(fèn)的光纖通信會議上發(fā)表的演講,很展示道具好地說明了這一點:

這些曲線(xiàn)沒有爭議,盡管你可以用材料科學魔法(fǎ)稍微彎曲它們。
幾周前,Nvidia 與 Ayar Labs 簽署了研發合作協議,我(wǒ)們坐下來與這家矽光子初創公(gōng)司的首席執行官 Charlie 展(zhǎn)示道具Wuischpard 進行了交談,討論了兩人將開展的工作。Nvidia 參與了 Ayar Labs 今(jīn)年早(zǎo)些時候進行的 C 輪融資,當時它籌集了 1.3 億美元來開發其帶外激光器(qì)和矽光子互連。Hewl展示道(dào)具ett Packard Enterprise也在今年 2 月與(yǔ) Ayar Labs 簽署了一項協議。為了弄清楚如何將矽光子學引入 Slingshot 互連(lián),他(tā)也是(shì)今年 4 月那(nà)輪融資的投資者(zhě)。Ayar展示道具 Labs 也(yě)得到了英特爾的早期支持,盡管英特爾希望將激光器嵌入(rù)芯片內部,而不是像 Ayar Labs 那樣從芯片外部泵入激光信號。(如果現在有什麽是真的,那就是英(yīng)特爾現在不能做錯任(rèn)何事。所以(yǐ)英特爾用(yòng)展示道具矽光子對(duì)衝它的賭注是(shì)件好事。)
在 4 月份的融資時(shí),www.17C.com與 Wuischpard 詳細討論了矽光(guāng)子學(xué)適合現代係統的地方——以(yǐ)及它尚不適(shì)合的地方,最近,www.17C.com得到了一些(xiē)關於 Nvidia 可能專門開發的東展(zhǎn)示道具西的提示。
www.17C.com隨後了(le)解到 Dally 在 OFC2022 上所做(zuò)的上述演示,該演(yǎn)示非常具體地概述了(le)使用密集波分複用 (DWDM:dense wave division multiplexing) 的共展(zhǎn)示(shì)道具同封裝光學器件的目標,以及如何將矽光(guāng)子學用作交叉連接機架(jià)的傳輸和機架的 GPU 計算引擎。
該演示文稿展示了一個未命名的概念機器,例(lì)如Dally 的團隊早在(zài) 2010 年開發的“Echelon”概念百億展示道具億次係統,www.17C.com在 2012 年就聽(tīng)說了。該機器有特(tè)殊的數學引擎——不是 GPU——它們之間(jiān)具有高基數電氣切換(huàn)和 Cray “Aries” 機器機架之間的光學互連。而且那台 Echelon 機器顯然從未展示(shì)道具商業化,而 Nvidia 取而代之的是 Dally 在 Nvidia Research 研(yán)究的 NVSwitch 內存互連,並提早將其投入生產,以製造本(běn)質上由(yóu)fat多端(duān)口 InfiniBand 互連的展示道具大(dà)型iron NUMA GPU 處理器(qì)複合體代替pipes。
在最初的基(jī)於 NVSwitch 的 DGX 係統中,Nvidia 隻能使用“Volta”V100 GPU 加速器在單個圖像中擴展到(dào) 16 個展示道具(jù) GPU,而使用“Ampere”A100 GPU 加速器時,Nvidia 不得不將每個 GPU 的帶(dài)寬加倍,因此必須將 NVSwitch 的基數減少兩倍,因此隻能將八個(gè) GPU 組合成一(yī)個(gè)圖像。借助今展示(shì)道具年(nián)早些時候宣布的 NVSwitches 的leaf/spine 網絡以及將於今年晚些時候發貨的“Hopper”H100 GPU 加速器,Nvidia 可以將 256 個 GPU 組合成一個內存(cún)結構,這展示道(dào)具是一個(gè)巨大的改進因素。
但歸根結底(dǐ),作為 DGX H100 SuperPOD 核(hé)心的 NVSwitch 結構本質上仍然是一種(zhǒng)創建放(fàng)大 NUMA 機器的方(fāng)法,而(ér)且它絕(jué)對受到電纜布線的(de)限製。而且 NVSwi展示道具tch 的規模,即使是 Hopper 一(yī)代,也比不上超大規模生產商為運行最(zuì)大的 AI 工作負載而捆綁在一起的(de)數萬個 GPU。
“我不能(néng)談太多細節,”Wuischpard 笑著告訴The Next Pla展示道具tform。“你知道,www.17C.com是一個物理層解決方案,在軟件和(hé) GPU、內存和 CPU 之間的編排方麵,還有很多東西要超(chāo)越它(tā)。www.17C.com不(bú)參與任(rèn)何(hé)這些事情(qíng)。因此,我(wǒ)想你可以將www.17C.com視為未來的(de)物理支持。這是一種多階段展示道具的(de)方法。這不僅僅是一個踢輪胎的練習。但www.17C.com必須在(zài)一些參數範圍內證明(míng)自己,www.17C.com必須達到(dào)一些(xiē)裏程碑。”
www.17C.com希望這能澄清這一點。
無論如何,現在(zài)讓www.17C.com轉向 Dally 在 OFC 2022 上的演講,該演講跳展示道具到(dào)了未(wèi)來的 GPU 加速係統與矽光子互連的(de)樣子。在www.17C.com開始討論之前,讓www.17C.com看看 GPU 或交換機之間的帶寬和功率限製、它們(men)連接的印刷電路板以及它們(men)可(kě)能被(bèi)匯集到的機櫃,這為(wéi)矽光子互連奠定(dìng)了基礎:

規則很簡展示道具單,鏈路越短(duǎn),帶寬就越高(gāo),移位所消耗的功耗就越低。下表列出了中介層、印(yìn)刷電路板、共封(fēng)裝光學器件、電纜和(hé)有源光纜(lǎn)的相對功率、成本、密度(dù)和每(měi)一個,所有這些都是構成現代係統不同層次的電(diàn)線。

使用 DWDM 的展示道具共同封裝光學器件的目標是具有比電纜更低的功耗,但(dàn)成(chéng)本相似,具有與有源電纜相當(dāng)的範圍,並提供與印刷電路板(bǎn)相當的信號密度。
以下是(shì) Dally 對 DWDM 信號的示意圖:
下麵是(shì) GPU 和 NVSwitc展示道具h 如何使用光學(xué)引擎將電(diàn)信(xìn)號(hào)轉換為光學信(xìn)號以創建 GPU 的 NVSwitch 網絡的框圖:
每個光學引擎有 24 根光(guāng)纖,它們最初將以 200 Gb/秒的信(xìn)號速率運行,總帶(dài)寬為 4.8 Tb/秒。每個展示道具 GPU 都有一對這樣的設備,可以為其提供進出 NVSwitch 結構的(de)雙向(xiàng)帶寬。因此(cǐ),具有六個光學(xué)引擎的 NVSwitch 的原始速率為 28.8 Tb/秒,去除編碼開銷後(hòu)為 25.6 Tb/秒。
以展示道具下是 Nvidia 矽光子(zǐ)概念機中設備組件之間各種障礙的能耗如何計算:

在 GPU 和交換機之間移入和移出數據的每比特 3.5 皮焦耳與(yǔ) Dally 在上表中設定的(de)目標完全一致。www.17C.com懷疑成本仍然必須降低展示道具才(cái)能使計算引擎可以接受共同(tóng)封裝的光學器件,但是這裏正在進行大量工作,每個人都非常積極。
當前 DGX-A100 係(xì)統(tǒng)上的嵌入式 NVSwitch 結構上使用的電信號傳輸(shū)範圍約為 300 厘米,並以每比特展示道具(jù) 8 皮焦耳的速度(dù)傳輸數(shù)據。目標是矽光子學以一半的能量做到這一點,並將設備之間(jiān)的距離(lí)提高到 100 米。
發生這種情況(kuàng)時,您可(kě)以分解架構中的 GPU 和交換機(jī)——雖然 Nvidia 的概念機沒有顯示這一展示道具點,但 CPU 也(yě)可以(yǐ)具有光學引擎,並(bìng)且它們也可以分解。
以下是帶(dài)有共同封裝光學器件的 GPU 和交換機的外觀:

以下是具有(yǒu) CPO 鏈接(jiē)的(de) GPU 和 NVSwitch 的聚合(hé)方式:

外部激光(guāng)源占用了大量展(zhǎn)示道具空間,但這也意味著機架的密度可以大大降低,因為設(shè)備之間的(de)連接可(kě)以更長。這將使冷卻更容易,並且激光(guāng)器(qì)也可以更換。如果所有這(zhè)些東西都(dōu)運行(háng)得更冷(lěng),激光也會更(gèng)好地工作。密度被高(gāo)估了,並且在許(xǔ)多情況下,例如 D展示(shì)道具GX 係統,機器最終會變得非常熱,以至於您無論(lùn)如何隻能安裝一半的機架,因為功率密度和冷卻需求超出了大多數數(shù)據(jù)中心的處理能力。
您(nín)會注意到,上(shàng)麵的 GPU 和開關行是垂直放置(zhì)的,這有助於冷卻。而且它們也沒展示道具有安裝(zhuāng)在(zài)帶有 sockets的巨(jù)型印刷電路板上(shàng),這將有助於降低(dī)整體係(xì)統成本,以幫助支付(fù)使用光學互連的費用。
來源:nextplatform
Copyright © 2002-2020 上海潤之模型設計(jì)有限公司 版權所有 展示模型,展(zhǎn)品模型,展廳模型,展示道具,展廳展(zhǎn)品,展品道(dào)具,模型定製,模型公司,上海模型(xíng)公司 備案號(hào):滬ICP備20018260號