以客戶為中心,提供定制化或一站式的全棧解決方案,賦能千行百業(yè)
高性能計算(High performance computing) 指通常使用很多處理器(作為單個機器的一部分)或者某一集群中組織的幾臺計算機(作為單個計算資源操作)的計算系統(tǒng)和環(huán)境。高性能集群上運行的應用程序一般使用并行算法,把一個大的普通問題根據(jù)一定的規(guī)則分為許多小的子問題,在集群內(nèi)的不同節(jié)點上進行計算,而這些小問題的處理結(jié)果,經(jīng)過處理可合并為原問題的最終結(jié)果。由于這些小問題的計算一般是可以并行完成的,從而可以縮短問題的處理時間。高性能計算在一個國家的科研中居于基礎性地位,是科技創(chuàng)新的動力源之一。以E級超級計算機為代表的高性能計算具有廣闊的應用前景,有望在氣候科學、可再生能源、基因組學、天體物理學以及人工智能等領(lǐng)域“大顯身手”。
寶德公司力推的高性能集群是專門為滿足大規(guī)模分析計算而設計的超級并行計算機集群系統(tǒng),它遵循 Intel 開放的 HPC 生態(tài)體系架構(gòu)來系統(tǒng)的部署所有的軟硬件:采用Intel 基于酷睿架構(gòu)的雙路 Xeon 和多路 Xeon 作為計算節(jié)點。寶德高性能計算集群采用集群體系結(jié)構(gòu),通過標準開放的高速網(wǎng)絡實現(xiàn)互連,運行開放源代碼的 Linux 系統(tǒng),對外提供單一系統(tǒng)接口,它針對大規(guī)??茖W并行計算設計,兼顧事務處理和網(wǎng)絡信息服務。
該方案主要通過構(gòu)建管理節(jié)點、計算節(jié)點、以及分布式存儲資源池,構(gòu)建計算力高達100Tflops以上的計算能力高性能計算集群,存儲采用高性能低延遲得SSD分布式存儲池,以及大容量得HDD分布式存儲池。滿足對于高性能計算力以及高速存儲IO帶寬的需求。
【硬件部分】
計算節(jié)點:CPU計算節(jié)點
管理節(jié)點:雙路服務器
登陸節(jié)點:雙路服務器
存儲節(jié)點:分布式并行存儲
網(wǎng)絡系統(tǒng):包含以太網(wǎng)絡系統(tǒng)、 光纖存儲網(wǎng)絡、機柜、PDU等
【軟件部分】
操作系統(tǒng):CentOS 7
集群軟件:資源管理與調(diào)度軟件Powercloud
開發(fā)環(huán)境:Fortran/C/C++等
并行環(huán)境:OpenMP、OpenMPI、MVPAICH2等MPI并行環(huán)境
文件系統(tǒng):分布式并行文件系統(tǒng)
應用軟件:客戶自帶應用軟件
計算網(wǎng)絡采用高速的100G IB網(wǎng)絡,確保用戶的計算任務在運行過程中不受網(wǎng)絡帶寬的限制,業(yè)務網(wǎng)絡使用25G以太網(wǎng)路,延遲低速度快。兩層高速網(wǎng)絡保障集群中所有節(jié)點無阻塞、全線速的運行,可充分滿足高速互聯(lián)的需求。
計算節(jié)點由寶德四路服務器組成,每臺四路服務器可支持4個英特爾可擴展系列處理器,以及最大96個內(nèi)存插槽,多核心計算能力和大內(nèi)存運行能力,為要求苛刻的HPC和橫向擴展工作負載提供動力。
存儲資源分為兩個分布式資源池,其中SSD存儲池運行重要數(shù)據(jù)和熱數(shù)據(jù),HDD存儲池保存冷數(shù)據(jù)和大容量數(shù)據(jù),同時兼顧IO性能和容量。
整套集群采用多種可靠性設計方案大幅度提升系統(tǒng)的可靠性,確保系統(tǒng)無單點故障。同時為用戶提供簡單易用的使用和維護接口,降低系統(tǒng)的使用維護門檻,提高整套系統(tǒng)的維護效率