1引言
隨著信息技術(shù)的發(fā)展,艦船設(shè)計(jì)開發(fā)逐步采用數(shù)字化技術(shù),通過三維設(shè)計(jì)軟件建立艦船的數(shù)字模型,加載環(huán)境、力學(xué)、機(jī)、電等信息,建立具有物理、功能和性能特性的虛擬樣機(jī),結(jié)合大量模型試驗(yàn)和實(shí)船試驗(yàn)得到的參數(shù),進(jìn)行CAE數(shù)字仿真分析,對產(chǎn)品進(jìn)行虛擬測試,取代部分物理樣機(jī)的試驗(yàn),驗(yàn)證艦船產(chǎn)品的性能,在此基礎(chǔ)上,建立包含設(shè)計(jì)、制造、運(yùn)行和維護(hù)整個(gè)艦船產(chǎn)品生命周期信息的虛擬樣機(jī),實(shí)現(xiàn)全過程數(shù)字化,縮短開發(fā)和試驗(yàn)周期,實(shí)現(xiàn)柔性設(shè)計(jì)和敏捷制造,保證艦船產(chǎn)品的安全可靠,提高自主創(chuàng)新能力具有重要意義。
CAE技術(shù)在艦船結(jié)構(gòu)設(shè)計(jì)中得到廣泛應(yīng)用,對工程和產(chǎn)品進(jìn)行性能與安全可靠性分析,對其未來的工作狀態(tài)和運(yùn)行行為進(jìn)行模擬,及早發(fā)現(xiàn)設(shè)計(jì)缺陷,并證實(shí)未來工程、產(chǎn)品功能和性能的可用性與可靠性。特別是測試驗(yàn)證船舶總體和局部結(jié)構(gòu)強(qiáng)度、船舶總體和局部結(jié)構(gòu)振動特性、結(jié)構(gòu)主要節(jié)點(diǎn)疲勞性能等,模型試驗(yàn)、實(shí)物試驗(yàn)與計(jì)算結(jié)合的,經(jīng)驗(yàn)方法和計(jì)算方法的結(jié)合,更正確的把握測試結(jié)果和方法。
大型快速遠(yuǎn)洋水面艦船,產(chǎn)生極大的波浪載荷和靜水載荷,需進(jìn)行結(jié)構(gòu)疲勞和斷裂分析;大型載機(jī)艦船,其飛機(jī)起降載荷復(fù)雜,瞬間沖擊力特別大,且起降形式不同,會產(chǎn)生高溫?zé)釕?yīng)力,承擔(dān)沖灘登陸任務(wù)艦船,遭遇碰撞、觸礁和擱淺,對其破壞程度后評估也是高度非線性問題,另外,軍事艦船其特殊的使命,本身攜帶爆炸物、也易受各種空中、水面和水下爆炸物攻擊,研究艦船遭遇爆炸各種形式(艙內(nèi)爆炸、空中、水面和水下接觸和非接觸爆炸),預(yù)報(bào)其遭遇破壞程度,更是瞬間高度非線性問題,需要用具有顯式積分方法解決的瞬態(tài)非線性程序;而對艦船極限承載力和生命力預(yù)報(bào)和評估、艦船各種武備如導(dǎo)彈、火炮發(fā)射的沖擊力等分析,也需要采用各種算法好、運(yùn)算速度快的高級非線性分析軟件;對于大型水面艦船設(shè)計(jì)都具有聲隱聲要求,其艦船的振動及響應(yīng)、噪聲預(yù)報(bào)是一項(xiàng)關(guān)鍵技術(shù),艦船噪聲覆蓋聲學(xué)分析的底頻、中頻和高頻率空氣噪聲和機(jī)械噪聲,需要有完善的解決低、中和高頻率噪聲分析的系統(tǒng)軟件,由于聲源除了空氣和機(jī)械外,船舶動力設(shè)備引起的船舶振動和響應(yīng),螺旋槳激勵等也是主要產(chǎn)生噪聲源,也需要先用CFD軟件預(yù)報(bào)激勵;整艦船進(jìn)行精細(xì)強(qiáng)度分析。
本文的目標(biāo)是建設(shè)一個(gè)公用的高性能計(jì)算支持平臺,用來進(jìn)行建模與結(jié)構(gòu)分析及計(jì)算流體力學(xué)等方面的數(shù)值模擬,以滿足目前計(jì)算需要,同時(shí)考慮計(jì)算規(guī)模增加、新應(yīng)用程序引進(jìn)所帶來的擴(kuò)展性問題。
2高性能計(jì)算平臺的選型要求
2.1強(qiáng)大的計(jì)算能力
本文所搭建的高性能計(jì)算平臺應(yīng)是一個(gè)復(fù)雜的高性能計(jì)算環(huán)境,這種計(jì)算環(huán)境不僅涉及專用計(jì)算軟件的性能、而且要涉及計(jì)算機(jī)系統(tǒng)的綜合運(yùn)算性能。
目前64位環(huán)境下處理軟件和硬件都已經(jīng)成熟,為了提高現(xiàn)有設(shè)備的處理能力,應(yīng)采用64位高性能集群以提供更高的計(jì)算能力。處理能力應(yīng)能滿足大規(guī)模網(wǎng)格點(diǎn)模型的結(jié)構(gòu)與流體分析,要求單CPU及計(jì)算服務(wù)器整體具有強(qiáng)大的運(yùn)算能力。
由于整個(gè)環(huán)境涉及面比較廣,在此僅以中央處理器(CPU)和內(nèi)存的選擇為例稍作展開。
2.1.1處理器性能最大化原則
在引言需求中所列出的應(yīng)用領(lǐng)域存在一個(gè)現(xiàn)象,即很多作業(yè)的運(yùn)行時(shí)間很難通過增加所使用的處理器數(shù)量來減少。下面分別列出了ABAQUS和ANSYS在典型高性能計(jì)算機(jī)上不同個(gè)數(shù)處理器上運(yùn)行標(biāo)準(zhǔn)測試所花費(fèi)的時(shí)間。
表1 ABAQUS和ANSYS測試多處理器并行對照表
ABAQUS是典型的非線性有限元分析程序,從上表可以看出,即使使用4個(gè)CPU,也無法將計(jì)算時(shí)間縮短至只使用一個(gè)CPU時(shí)的50%。而ANSYS多處理器并行的效率更差。
即使在計(jì)算流體動力學(xué)應(yīng)用中(例如Fluent),作業(yè)運(yùn)行時(shí)間也嚴(yán)重受限于計(jì)算網(wǎng)格數(shù)的大小,下表選擇了三個(gè)不同規(guī)模的Fluent標(biāo)準(zhǔn)測試考察多處理器并行時(shí)的加速效果。
表2 Fluent測試多處理器并行對照表
分頁
可見在三個(gè)例題之中只有網(wǎng)格數(shù)達(dá)到847,000的戰(zhàn)斗機(jī)跨音速外流計(jì)算才能保證直到8個(gè)處理器都可以獲得比較理想的加速比。換句話說,如果解題規(guī)模或物體外形達(dá)不到上題的復(fù)雜程度,使用超過8個(gè)處理器進(jìn)行并行運(yùn)算是沒有必要的。
分析以上數(shù)據(jù)我們可以得出結(jié)論,若要提高工作效率,縮短作業(yè)的運(yùn)行時(shí)間或者在一定的時(shí)間內(nèi)運(yùn)行更多的作業(yè)或更復(fù)雜的作業(yè),首先應(yīng)該盡可能提高單處理器的性能。也就是說,由8個(gè)相對性能為l的處理器構(gòu)造的高性能計(jì)算系統(tǒng)不如使用由4個(gè)相對性能為2的處理器組成的高性能計(jì)算系統(tǒng)的使用效果好,理想狀態(tài)下對兩個(gè)4 CPU的作業(yè)它們的性能是一樣的,而對于一個(gè)4CPU作業(yè)來講后者只需前者一半的時(shí)間就可完成作業(yè)。
選擇性能盡可能高的處理器還有另一個(gè)好處,就是在得到同樣的運(yùn)行效率的前提下,在應(yīng)用軟件許可證上的花費(fèi)更少。
因此,我們在設(shè)計(jì)本高性能計(jì)算平臺時(shí)首先確定的原則就是處理器性能最大化的原則。
2.1.2內(nèi)存的設(shè)計(jì)
在進(jìn)行了數(shù)項(xiàng)應(yīng)用的標(biāo)準(zhǔn)測試之后,我們得出,在系統(tǒng)中為每個(gè)處理器配置4GB以上內(nèi)存即可獲得滿意的效果,另外,需采用盡可能高速的內(nèi)存,以獲得盡可能大的內(nèi)存帶寬。
2.2高性能I/O
本文所搭建的高性能計(jì)算平臺應(yīng)是一個(gè)要求采用最新技術(shù)解決專業(yè)應(yīng)用的復(fù)雜的生產(chǎn)系統(tǒng),由于其本身應(yīng)用的特點(diǎn)要求整套計(jì)算機(jī)系統(tǒng)運(yùn)行必須穩(wěn)定、技術(shù)必須成熟。這種運(yùn)行穩(wěn)定性包括計(jì)算機(jī)系統(tǒng)與專業(yè)軟件系統(tǒng)之間的配合、I/O系統(tǒng)與存儲系統(tǒng)之間的穩(wěn)定性、計(jì)算機(jī)系統(tǒng)本身的技術(shù)成熟性等諸多內(nèi)容。在運(yùn)行過程中,每個(gè)作業(yè)需要約數(shù)十GB的存儲空間存放中間臨時(shí)文件,并對這些臨時(shí)文件進(jìn)行頻繁的讀寫操作,因而對系統(tǒng)的I/O性能提出要求較高。
實(shí)踐證明,以NASTRAN為代表的部分應(yīng)用的性能與系統(tǒng)的磁盤I/0性能有極大的關(guān)系,正確設(shè)計(jì)磁盤系統(tǒng)消除I/0瓶頸后,其性能甚至可有幾倍的提高。因此我們在設(shè)計(jì)本系統(tǒng)中將保證磁盤I/O性能與系統(tǒng)計(jì)算性能相匹配,其設(shè)計(jì)手法為磁盤I/0的并行化(硬件)和采用并行文件系統(tǒng)(軟件)。
并行I/0的一個(gè)額外好處是透明的文件緩存機(jī)制可以消除交互用戶在后臺有大量批量作業(yè)I/0產(chǎn)生時(shí)出現(xiàn)的長響應(yīng)時(shí)間,為交互客戶提供了更友善的使用和更高的服務(wù)質(zhì)量。
2.3強(qiáng)大的資源管理和作業(yè)調(diào)度功能
高性能計(jì)算機(jī)除了具有處理超大規(guī)模的計(jì)算任務(wù)外,還應(yīng)有支持多用戶、多作業(yè)的能力。這就要求系統(tǒng)具有強(qiáng)大的資源管理和作業(yè)調(diào)度功能,以充分、高效地使用計(jì)算機(jī)資源。系統(tǒng)管理員可以根據(jù)應(yīng)用的具體需求制定管理規(guī)則,實(shí)現(xiàn)作業(yè)的自動調(diào)度、優(yōu)先級管理,用戶的資源分配等復(fù)雜的功能。
2.4作業(yè)的斷點(diǎn)/續(xù)算(Checkpoint/Restart)功能
當(dāng)運(yùn)行較大規(guī)模的計(jì)算作業(yè)時(shí),一個(gè)題目可能會運(yùn)行幾天甚至幾個(gè)星期。如果在此期間需要做系統(tǒng)維護(hù),或因有一個(gè)緊急的計(jì)算任務(wù)需要盡快完成,而必須停止其它正在運(yùn)行的題目,那么某些應(yīng)用程序就會被中斷。如果這些應(yīng)用程序本身沒有保存中間結(jié)果的功能,或保存中間結(jié)果的時(shí)間間隔較長,那么停機(jī)會給用戶造成不必要的時(shí)間浪費(fèi)。為此,要求系統(tǒng)具有完善的斷點(diǎn)/續(xù)算(Checkpoint/Restart)的功能,提供自動或手工為應(yīng)用程序保存中間計(jì)算結(jié)果,在系統(tǒng)停機(jī)/重新啟動后盡快恢復(fù)從斷點(diǎn)處繼續(xù)計(jì)算,減少了時(shí)間損失。同時(shí)應(yīng)該提供作業(yè)掛起功能,可以將不關(guān)鍵的作業(yè)掛起而并不殺掉進(jìn)程,為緊急的計(jì)算任務(wù)空出資源,待該任務(wù)完成后恢復(fù)計(jì)算。
2.5系統(tǒng)擴(kuò)展能力
隨著研究與業(yè)務(wù)的發(fā)展,原有應(yīng)用程序的計(jì)算規(guī)模會越來越犬,同時(shí)還會有新的應(yīng)用運(yùn)行在高性能計(jì)算系統(tǒng)上。當(dāng)現(xiàn)有的系統(tǒng)不能滿足計(jì)算要求時(shí),就涉及到系統(tǒng)擴(kuò)展問題。系統(tǒng)擴(kuò)展不應(yīng)該僅僅是硬件或計(jì)算能力的增加,它要求新增系統(tǒng)能充分地融合到現(xiàn)有的系統(tǒng)中,并仍能充分利用老的計(jì)算系統(tǒng),以保護(hù)投資。
分頁
3平臺架構(gòu)的搭建
根據(jù)以上需求分析,核心設(shè)計(jì)系統(tǒng)架構(gòu)將如下圖所示:
圖1核心設(shè)計(jì)系統(tǒng)架構(gòu)圖
其中CAD系統(tǒng)將運(yùn)行在圖形服務(wù)器(或工作站)上,不同的設(shè)計(jì)人員將采用其獨(dú)自的系統(tǒng)。CAE系統(tǒng)同樣運(yùn)行在圖形服務(wù)器(或工作站)上,但由于CAE的計(jì)算量巨大,因此核心處理和計(jì)算將運(yùn)行在高性能計(jì)算集群平臺上。CAD和CAE的數(shù)據(jù)可存放在其系統(tǒng)存儲上,如果采用了PDM管理平臺,CAD和CAE的數(shù)據(jù)將通過PDM系統(tǒng)存放在由PDM系統(tǒng)所管理的存儲服務(wù)器中,從而使數(shù)據(jù)得到更好的管理和應(yīng)用。
從系統(tǒng)平臺的選擇上來看,對于負(fù)責(zé)CAE系統(tǒng)核心處理和計(jì)算高性能計(jì)算的服務(wù)器集群,我們采用由4個(gè)高性能計(jì)算服務(wù)器節(jié)點(diǎn)組成的服務(wù)器集群,4個(gè)高性能節(jié)點(diǎn)將通過統(tǒng)一的高性能交換機(jī)進(jìn)行連接、數(shù)據(jù)交換和溝通。對于PDM應(yīng)用服務(wù)器和數(shù)據(jù)庫服務(wù)器,由于其重要性和對可靠性的要求,可采用不同的服務(wù)器來運(yùn)行,運(yùn)行應(yīng)用系統(tǒng)的服務(wù)器和運(yùn)行數(shù)據(jù)庫系統(tǒng)的服務(wù)器將組成HACMP高可靠性集群來保證服務(wù)器的高可靠性和可服務(wù)性。PDM系統(tǒng)的數(shù)據(jù)(包括CAD和CAE的數(shù)據(jù))將被存儲在集中的存儲服務(wù)器中,PDM數(shù)據(jù)庫將通過SAN網(wǎng)絡(luò)來將數(shù)據(jù)保存到SAN存儲服務(wù)器上。
SAN存儲服務(wù)器上將分配不同的存儲區(qū)域存儲不同應(yīng)用的數(shù)據(jù),如存放PDM數(shù)據(jù)的存儲空間和存放OA數(shù)據(jù)的存儲空間。當(dāng)然,如果CAB應(yīng)用和CAE應(yīng)用如果有數(shù)據(jù)需不通過PDM
而直接存放在本地的,則也可以通過加裝光纖卡來實(shí)現(xiàn)存放于SAC存儲服務(wù)器上。此外,由于對數(shù)據(jù)的可靠性要求很高,建議另外設(shè)置一個(gè)存儲服務(wù)器作為工作存儲服務(wù)器的備份。2個(gè)存儲服務(wù)器之間將通過鏡像方式實(shí)現(xiàn)數(shù)據(jù)的同步復(fù)制,即任何存放在工作存儲服務(wù)器上的重要數(shù)據(jù)將被同步拷貝到另外一個(gè)存儲服務(wù)器上。這樣的話,即使將來工作存儲服務(wù)器發(fā)生問題時(shí),所有的數(shù)據(jù)在備份存儲服務(wù)器上都有備份。再加上磁帶庫備份,人大降低了數(shù)據(jù)丟失的風(fēng)險(xiǎn)。
圖2高性能計(jì)算平臺架構(gòu)圖
4結(jié)束語
作為高性能計(jì)算應(yīng)用的主要領(lǐng)域之一,艦船設(shè)計(jì)領(lǐng)域人量采用了CAE和CAD技術(shù),對計(jì)算機(jī)系統(tǒng)的達(dá)算性能、運(yùn)行穩(wěn)定性有著很高的要求。隨著新技術(shù)的不斷推出,如何升級完善高性能計(jì)算平臺的話題也會不斷地被提出。然而高性能計(jì)算平臺的構(gòu)建并沒有一個(gè)絕對的模式,評價(jià)它成功與否的標(biāo)準(zhǔn)還在于是否滿足自身的實(shí)際需求。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.hanmeixuan.com/
本文標(biāo)題:高性能計(jì)算平臺架構(gòu)搭建之淺見
本文網(wǎng)址:http://www.hanmeixuan.com/html/support/1112154353.html