
隨著 AI 成為組織創(chuàng)新和競(jìng)爭(zhēng)優(yōu)勢(shì)不可或缺的一部分,對(duì)高效且可擴(kuò)展的基礎(chǔ)設(shè)施的需求比以往任何時(shí)候都更加迫切。NVIDIA 和 DDN Storage 之間的合作正在該領(lǐng)域樹立新的標(biāo)準(zhǔn)。通過將 NVIDIA BlueField 數(shù)據(jù)處理器 集成到 DDN EXAScaler 和 DDN Infinia,并以創(chuàng)新方式使用,DDN Storage 正在改變以數(shù)據(jù)為中心的工作負(fù)載。
NVIDIA 先進(jìn)的數(shù)據(jù)處理與 DDN 強(qiáng)大的存儲(chǔ)解決方案的協(xié)同作用可以優(yōu)化 AI 工作流程、增強(qiáng)運(yùn)營(yíng)、提高資源利用率,并在 AI 環(huán)境中支持多租戶。
在本文中,我們將重點(diǎn)介紹 Infinia 的集成優(yōu)勢(shì)。
集成式 DPU 存儲(chǔ)解決方案
DDN Infinia 是一個(gè)軟件定義數(shù)據(jù)平臺(tái),利用 BlueField-3 DPU 的強(qiáng)大功能來有效管理以數(shù)據(jù)為中心的工作負(fù)載,尤其是在加速計(jì)算和生成式人工智能方面。這種集成增強(qiáng)了多租戶,提高了運(yùn)營(yíng)效率,并增強(qiáng)了數(shù)據(jù)保護(hù)。這使得它成為組織使用人工智能和云技術(shù)驅(qū)動(dòng)創(chuàng)新和運(yùn)營(yíng)敏捷性的理想解決方案。
他們的解決方案包含幾個(gè)關(guān)鍵組件:
· 卸載數(shù)據(jù)處理
· 加速存儲(chǔ)性能
· 提高效率
· 支持多租戶
· 增強(qiáng)安全性
· 增強(qiáng)擴(kuò)展
卸載數(shù)據(jù)處理
BlueField DPU 通過接管數(shù)據(jù)處理任務(wù)來減輕 CPU 的負(fù)擔(dān),從而釋放計(jì)算資源并提高整體系統(tǒng)性能。這種存儲(chǔ)和安全任務(wù)卸載可提高 CPU 使用效率,減少延遲并加快數(shù)據(jù)處理速度。
加速存儲(chǔ)性能
DDN 的存儲(chǔ)解決方案由 BlueField DPU 提供支持,可增強(qiáng) AI 工作負(fù)載的存儲(chǔ)性能。借助 BlueField DPU 的高級(jí)數(shù)據(jù)處理能力,這些解決方案實(shí)現(xiàn)了更高的吞吐量和更高的系統(tǒng)響應(yīng)速度,以加速 AI 應(yīng)用。
NVIDIA GPUDirect Storage (GDS) 有助于在 GPU 平臺(tái)和存儲(chǔ)之間建立直接數(shù)據(jù)路徑,從而最大限度地減少系統(tǒng)內(nèi)存流量,進(jìn)而提高帶寬并減少 CPU 負(fù)載,以優(yōu)化 AI 工作流程。
提高效率
傳統(tǒng)存儲(chǔ)系統(tǒng)在通用型 x86 CPU 上執(zhí)行閃存管理、RAID、訪問控制和加密等各種任務(wù)。然而,隨著網(wǎng)絡(luò)速度和安全需求的增加,這些系統(tǒng)的效率也在下降。
在存儲(chǔ)服務(wù)器和主機(jī)訪問中集成 BlueField DPU 可通過卸載和加速 NVMe-oF 存儲(chǔ)協(xié)議等任務(wù),顯著提高存儲(chǔ)效率,從而為其他應(yīng)用程序釋放 CPU 周期。
支持多租戶
DDN Infinia 存儲(chǔ)平臺(tái)采用容器化,使不同存儲(chǔ)功能在單獨(dú)的容器中運(yùn)行,從而實(shí)現(xiàn)可擴(kuò)展性和整個(gè)數(shù)據(jù)路徑的優(yōu)化,通過將任務(wù)卸載到 DPU 降低延遲。
多租戶部署可在單個(gè)文件系統(tǒng)中整合多個(gè)命名空間,從而提高容量利用率、降低硬件成本并簡(jiǎn)化部署和管理。
BlueField DPU 基于硬件的隔離和資源分配功能,使多個(gè)用戶和應(yīng)用程序之間能夠安全共享基礎(chǔ)設(shè)施資源,從而提高資源利用率和運(yùn)營(yíng)效率。

DDN Infinia 提供本地多租戶功能,用于安全隔離用戶數(shù)據(jù);在所有租戶和子租戶中應(yīng)用高效的質(zhì)量服務(wù)算法;以及確保在傳輸、靜態(tài)和組織之間共享期間的數(shù)據(jù)保護(hù)。
增強(qiáng)安全性
BlueField DPU 的專用處理資源和內(nèi)存提供了一個(gè)安全的環(huán)境,可防止未經(jīng)授權(quán)的訪問并抵御潛在的攻擊。硬件加速加密可確保存儲(chǔ)系統(tǒng)中存儲(chǔ)的數(shù)據(jù)經(jīng)過靜態(tài)加密,從而保護(hù)敏感信息。
BlueField DPU 的訪問控制機(jī)制使管理員能夠定義和執(zhí)行細(xì)粒度訪問策略,以確保只有授權(quán)用戶或應(yīng)用程序才能訪問和修改數(shù)據(jù)。此外,還提供安全啟動(dòng)功能,以在啟動(dòng)過程中驗(yàn)證固件和軟件組件的完整性,從而防止篡改或未經(jīng)授權(quán)的修改。
卸載安全相關(guān)任務(wù)從主機(jī) CPU 可減少攻擊面,并釋放 CPU 資源用于其他關(guān)鍵任務(wù)。
借助這些組合安全功能,BlueField DPU 為 AI 工作負(fù)載以及從 DPU 到 CPU 的數(shù)據(jù)提供了可靠且安全的存儲(chǔ)解決方案。組合技術(shù)堆棧確保數(shù)據(jù)始終受到保護(hù),從而解決 AI 驅(qū)動(dòng)環(huán)境中的數(shù)據(jù)安全性和完整性問題。您的組織可以針對(duì)網(wǎng)絡(luò)威脅和未經(jīng)授權(quán)的訪問提供更出色的保護(hù),增強(qiáng)整體數(shù)據(jù)的安全性和合規(guī)性。
增強(qiáng)擴(kuò)展
DDN Infinia 是一個(gè)完全容器化的平臺(tái),圍繞一組編排的微服務(wù)構(gòu)建,以提供整個(gè)存儲(chǔ)服務(wù)。通過使用 BlueField 數(shù)據(jù)處理器,DDN 開發(fā)了一種支持完整云原生堆棧的全新架構(gòu)。這種對(duì) BlueField 數(shù)據(jù)處理器的創(chuàng)新使用使存儲(chǔ)平臺(tái)能夠跨網(wǎng)絡(luò)擴(kuò)展。
具體來說,DDN Infinia 的 Amazon S3 對(duì)象服務(wù)是容器化的,可以獨(dú)立于 Infinia 存儲(chǔ)系統(tǒng)運(yùn)行,通過使用 NVIDIA DGX 客戶端系統(tǒng)中 NVIDIA 數(shù)據(jù)處理器(DPU)的資源。這種設(shè)計(jì)轉(zhuǎn)變徹底改變了數(shù)據(jù)流通過存儲(chǔ)系統(tǒng)的方式。傳統(tǒng)上,Amazon S3 對(duì)象調(diào)用是在本地對(duì) BlueField 上運(yùn)行的服務(wù)進(jìn)行的,而現(xiàn)在這種調(diào)用可以直接在 NVIDIA DGX 客戶端系統(tǒng)中進(jìn)行,從而避免了通過網(wǎng)絡(luò)發(fā)送命令(RESTful 調(diào)用)的延遲。
借助 BlueField,這些調(diào)用被從 DPU 到存儲(chǔ)系統(tǒng)的 RDMA 調(diào)用所取代。這將卸載主系統(tǒng)的存儲(chǔ)任務(wù),并使用更高效的數(shù)據(jù)路徑,從而顯著減少延遲并提高人工智能加速的帶寬。這種存儲(chǔ)架構(gòu)的重新配置改變了 Amazon S3 對(duì)象數(shù)據(jù)路徑,顯著提高了性能和可擴(kuò)展性。
