東方物探是業(yè)內(nèi)耳熟能詳?shù)膶I(yè)“找油”公司,近年來,承擔國內(nèi)外的內(nèi)外陸地、淺海地震勘探,及綜合物化探采集、處理、解釋的數(shù)個重大項目。即便如此,東方物探依然在提高自身相關(guān)技術(shù)上下狠功夫,大量投入資金購置計算機軟、硬件設(shè)備,以確保高效、安全地交付工程任務。在總工程師賴能和的眼里,如何用好這些軟硬件并提高其性能,成為他工作的重中之重。
日前,記者采訪了賴能和先生。他表示,在英特爾的協(xié)助下,進行必要的合理配置軟硬件,就能實現(xiàn)整體系統(tǒng)負載平衡。東方物探目前擁有5.8萬個核,運算能力達到528萬億次/秒(528T),存儲達8000個T。在2011年一共引進的2498個CPU中,90%來自英特爾。
合理配置
實現(xiàn)HPC平衡負載
據(jù)賴能和介紹,對于一臺高性能計算機,要實現(xiàn)最大效益,不僅需要硬件系統(tǒng),還要有配套的系統(tǒng)軟件、應用軟件,可謂“平衡”。比如并行文件系統(tǒng),一些操作系統(tǒng)的優(yōu)化,英特爾公司和BGP進行了近六年的合作,主要體現(xiàn)在GeoEast軟件開發(fā)上。
從應用軟件角度講,優(yōu)化則更明顯,每一套應用軟件要采用英特爾編譯系統(tǒng)。英特爾的專家針對GeoEast軟件在石油行業(yè)的應用,提出了很多建議。如時間偏移,他們進行持續(xù)跟蹤,根據(jù)應用采用有效工具對軟件進行特征分析,使“時間偏移”軟件性能當時就提高5倍左右;其次是三維RNA,該模塊非常費時,英特爾公司幫助進行優(yōu)化,目前已經(jīng)取得極大進展。
賴能和告訴記者,東方物探這幾年投入上千萬做技術(shù)改造,目的是要提高CPU利用率,提高存儲性能,確保數(shù)據(jù)安全及降低能耗。
CPU的架構(gòu)和網(wǎng)絡技術(shù)、存儲、存儲網(wǎng)絡、核心應用等,都會影響CPU利用率。因此,合理選擇CPU的主頻,可有效提高CPU利用效率。賴能和認為,不同的存儲架構(gòu),差別非常大,萬兆的性能遠遠超過千兆,兩者相差5倍。不同的存儲品牌,性能差別也很大,存儲網(wǎng)絡對存儲的性能影響同樣非常大。要優(yōu)化配置,存儲關(guān)鍵是參數(shù)。從這五個方面提升I/O的性能,便可提升整個系統(tǒng)存儲性能,最終達到提高CPU利用率的目的。協(xié)調(diào)好上述五方面,才能建立一個平衡的計算機系統(tǒng)。賴能和總工指出,要建造一套高性能、高效率的計算機,需要英特爾這樣擁有雄厚技術(shù)力量做支撐和后盾的公司。
近五年來,存儲是作為目前石油行業(yè)在IT設(shè)備里增長最快的一項,每年增長在2500~3000T左右,而目前價格卻都在下降。賴能和介紹說,從性能上他們也在選擇一些高性能的存儲。英特爾提出SSD,因為它功耗非常低,I/O讀寫性非常好,他們現(xiàn)在正在做數(shù)據(jù)庫應用的嘗試,全部采用SSD(固態(tài)硬盤),同時高性能計算機的內(nèi)置盤也開始嘗試用SSD,以后可能會用得比較多。
如何更好地優(yōu)選軟、硬件
CPU、APU、GPU,業(yè)內(nèi)已經(jīng)很熟悉,尤其是GPU目前被炒得很熱。東方物探目前擁有184個GPU,一個168個GPU是整裝。當然GPU還有很多不足的地方。賴能和建議,選擇GPU時,不注意選密度。因為密度高,其功耗、噪音非常大,穩(wěn)定性還有些不足。目前GPU在工業(yè)界用得非常多,主要的服務商全部都支持。“我們曾做過測試,軟件在上面跑的效果不錯,全部采用英特爾至強處理器,8萬個核,不到兩天就完成了。”
“網(wǎng)絡方面選擇時也要注意,因為大家可能會選萬兆。“賴能和坦言,當時他們選用的是銅纜,集成困難較多,容易出問題。”GPU是好東西,但還很新,很多東西都需要摸索。”
目前的多路服務器,國內(nèi)非常多,應用非常好,尤其像惠普、IBM、曙光、聯(lián)想等都有2路、4路、8路,特別是8路服務器用得比較多。賴能和透露,東方物探目前有二三十套8路服務器。
云計算是把很多計算機聯(lián)網(wǎng)或者自動傳到計算機上,減少終端用戶的負擔,目前受到廣泛關(guān)注。云計算被國家列為新興產(chǎn)業(yè)重要發(fā)展戰(zhàn)略之一,市場潛力比較大。賴能和總工指出,“我們要保持清醒,尤其是從事計算機領(lǐng)域的工作者,需要跟上級領(lǐng)導客觀反映。現(xiàn)在有很多問題沒有解決。一是云計算發(fā)展的相關(guān)法律法規(guī)沒有解決,這關(guān)系到數(shù)據(jù)安全問題,誰來保護數(shù)據(jù)安全。二是知識產(chǎn)權(quán)的相關(guān)內(nèi)容。如目前石油數(shù)據(jù)處理,世界上沒有一家公司把所有數(shù)據(jù)處理任務都放在云平臺上,因為數(shù)據(jù)的移動很大,很難做。三是一些核心技術(shù)需要突破。芯片、服務器、存儲、設(shè)備要繼續(xù)發(fā)展,云計算要客觀理解和對待,但我們還是要跟蹤,我的觀點是要緊密跟蹤,客觀評價。”