您現(xiàn)在的位置:首頁 >關(guān)于我們 >行業(yè)新聞 >在數(shù)據(jù)中心和服務(wù)器機房內(nèi)從混亂中營造秩序

在數(shù)據(jù)中心和服務(wù)器機房內(nèi)從混亂中營造秩序

時間:2011年5月25日

在許多數(shù)據(jù)中心中,很容易發(fā)現(xiàn)混亂的現(xiàn)象。粗略查看未經(jīng)規(guī)劃的數(shù)據(jù)中心就可以發(fā)現(xiàn)很多不良的現(xiàn)象,例如地板磚缺失、大量雜亂的電纜,以及最初級的局部制冷。幸運的是,要實現(xiàn)數(shù)據(jù)中心的秩序,可以實施一些解決方案,啟動一定的流程,這些解決方案和流程可以是要求革命性的變化,也可以是促進(jìn)漸進(jìn)式的變化。

圖1 – 通過區(qū)域的模塊化部署來建立秩序

 

掌握控制權(quán):解決混亂的工具和方法

面對混亂現(xiàn)象的IT管理員可通過負(fù)責(zé)以下兩個領(lǐng)域的工作來解決這些問題:物理基礎(chǔ)設(shè)施部署和變更管理措施。硬件創(chuàng)新(可實現(xiàn)機柜獨立區(qū)域的便捷部署)和軟件開發(fā)(可實現(xiàn)合理的物理基礎(chǔ)設(shè)施變更管理)是對數(shù)據(jù)中心進(jìn)行成本合理且非破壞性的改造的兩個關(guān)鍵因素。

虛構(gòu)的物理基礎(chǔ)設(shè)施部署

由于數(shù)據(jù)中心正在逐步向可伸縮的模塊化機柜式解決方案發(fā)展,對混亂問題可以采用一個"補救"辦法。通過部署包括UPS電源、配電、監(jiān)測、電纜布設(shè)以及氣流解決方案的機柜式系統(tǒng),可在合理的成本下很容易地采用一種集成化的方式。

機柜已經(jīng)發(fā)展到可以容納更高密度的IT設(shè)備。選擇標(biāo)準(zhǔn)的機柜規(guī)格是重要的第一步。關(guān)于涉及機柜選擇依據(jù)的信息,請參見APC白皮書72號,"在高密度機箱內(nèi)實現(xiàn)高效空間組織的5個基本步驟"。

新的一排機柜可被設(shè)置為獨立的"區(qū)域",它位于數(shù)據(jù)中心內(nèi),但其運行獨立于現(xiàn)有的基礎(chǔ)設(shè)施(見圖1)。隨著現(xiàn)有混亂的基礎(chǔ)設(shè)施開始以逐機柜或逐排的方式逐步淘汰,這些有組織的區(qū)域可以進(jìn)行擴展。利用安裝集成式機柜系統(tǒng)的機會,隨著新設(shè)備逐步淘汰舊設(shè)備,混亂的增長可以轉(zhuǎn)換為受控制的增長。

變更管理行為的變化

變更控制是IT管理員掌控其命運的系統(tǒng)性方法。傳統(tǒng)的IT變更控制的特征是具有在IT環(huán)境中發(fā)起變更的正式請求,其后是對所提變更的正式審核,再后是對預(yù)期結(jié)果的分析,如果變更沒有按計劃出現(xiàn),則還需要闡明撤消計劃。

然而在這種方法中經(jīng)常被忽略的是引導(dǎo)IT與物理基礎(chǔ)設(shè)施演進(jìn)的變更控制流程的作用。畢竟IT基礎(chǔ)設(shè)施的故障影響的是一個應(yīng)用程序或系統(tǒng),而物理基礎(chǔ)設(shè)施(電源、制冷)的故障則可能潛在影響到所有應(yīng)用程序和系統(tǒng)。

圖2 – APC容量和變更管理器工具的畫面

 

通過采用自動化的變更控制流程(見圖2),IT管理員可以從系統(tǒng)角度對數(shù)據(jù)中心的演進(jìn)方式施加積極的影響。通過涵蓋數(shù)據(jù)中心環(huán)境的設(shè)施或物理基礎(chǔ)設(shè)施一方,IT管理員也可以使數(shù)據(jù)中心的演進(jìn)脫離產(chǎn)生組織混亂的老路。

可靠的廠商管理也是避免混亂的一個重要工具。向第三方采購設(shè)施和系統(tǒng)的趨勢模糊了性能質(zhì)量的責(zé)任問題。希望逐步改變混亂狀況的IT管理員應(yīng)堅持嚴(yán)格遵守標(biāo)準(zhǔn)的數(shù)據(jù)中心規(guī)范,包括變更控制流程,這些應(yīng)該是直接指揮系統(tǒng)之外任何服務(wù)合同的組成部分。只有通過讓所有數(shù)據(jù)中心人員以相同的績效標(biāo)準(zhǔn)工作,方可實現(xiàn)從混亂到秩序的演進(jìn)。

圖3 – 機柜背面的導(dǎo)線管理

 

混亂的原因

混亂的首要原因是無計劃、無控制的增長。隨著企業(yè)引入新的推動增長的流程,IT方面通過構(gòu)建和支持新的應(yīng)用來予以響應(yīng)。IT設(shè)備與數(shù)據(jù)中心合為一體,以支持應(yīng)用,而新系統(tǒng)則在忙亂、有期限限制的環(huán)境中部署。

新的服務(wù)器和應(yīng)用程序可以在幾天內(nèi)被獲取并投入使用。然而,附帶的物理基礎(chǔ)設(shè)施(活動地板、電纜、機柜、制冷、UPS、PDU)的安裝則可能需要數(shù)月時間。在時間的壓力下,設(shè)備的安裝經(jīng)常沒有考慮對數(shù)據(jù)中心完整性和可靠性的長期影響。

混亂的環(huán)境還伴隨著IT人員和供應(yīng)商人員的轉(zhuǎn)崗。這種轉(zhuǎn)崗會打斷任何可能隨時間發(fā)展的制度性學(xué)習(xí),由此妨礙秩序和組織的形成。最終,典型的結(jié)果是不斷添加服務(wù)器以及與之伴隨的通信和電源電纜,而不進(jìn)行任何有秩序的更換或重用流程。

圖4 – 架空電纜提供了一種擺脫壓力通風(fēng)系統(tǒng)混亂的方法

 

如果遺留的電纜問題是數(shù)據(jù)中心內(nèi)混亂的根本原因,而且電纜問題出現(xiàn)在活動地板以下,則明顯的解決方案就是安裝架空電纜和配電系統(tǒng),以支持IT設(shè)備,見圖4。由于新設(shè)備采用架空方式獲得供電和電纜連接,地板下方的電纜和電源可以棄置于原處,直至可以安全拆除而風(fēng)險最小時為止。

混亂的影響

氣流分布不佳

氣流分布不佳會導(dǎo)致服務(wù)器及相關(guān)IT設(shè)備過熱。IT服務(wù)器設(shè)備通常需要每分鐘150-200立方英尺的氣流量。這種氣流量將排出足夠的熱量,使排風(fēng)溫度升高15-20°F(8.3-11°C)。如果不發(fā)生這種熱傳遞,設(shè)備可能會停機、過早失效,或者使正被處理的數(shù)據(jù)破壞。

圖5 – 空白面板的安裝

 

電源系統(tǒng)容量管理不佳

配電電纜具有確定的容量,使得其在電路保護(hù)器(熔斷器或斷路器)斷開之前可以承擔(dān)的負(fù)載量受到限制。不加控制的電路分配會在超出電路極限時導(dǎo)致停機。當(dāng)有調(diào)節(jié)的電源(如UPS系統(tǒng))沒有得到良好的管理和維護(hù)時,也會出現(xiàn)停機。

自動化的容量管理系統(tǒng)(見圖2)可以自動分配并跟蹤單相和三相設(shè)備的耗用功率,確保電源系統(tǒng)上的全部三相承擔(dān)平衡的負(fù)載。此外,系統(tǒng)還可繪制系統(tǒng)的功率路徑圖,顯示物理系統(tǒng)關(guān)系和依存性。

通信混亂

不良的規(guī)劃會在電纜系統(tǒng)、接線板和設(shè)備互連達(dá)到容量極限時對通信產(chǎn)生約束。隨著電纜技術(shù)的發(fā)展,由于遺留電纜被棄用,用作系統(tǒng)間連接的電纜所經(jīng)的路徑逐漸達(dá)到飽和。當(dāng)通信光纜與銅纜以隨機方式混合布設(shè)時,這種飽和會產(chǎn)生深刻的影響。光纖容易斷裂,而且其所傳輸?shù)臄?shù)據(jù)量很大,使得線纜出現(xiàn)問題時造成的影響更大。不影響數(shù)據(jù)中心運行就無法解決線纜問題,這正是混亂得以擴散的主要原因。如果潛在影響是停機或中斷通信,IT管理員就不愿意去除空置或不使用的電纜。

圖6 – 轉(zhuǎn)至contained close-coupled™(密閉緊耦合式)制冷

 

旨在消除混亂的快速修理

要啟動在數(shù)據(jù)中心內(nèi)建立秩序的過程,可以采取許多措施:

² 以標(biāo)準(zhǔn)方式組織電源和數(shù)據(jù)電纜(詳情參見APC白皮書72號,"2在高密度機箱內(nèi)實現(xiàn)高效空間組織的5個基本步驟")(圖4)

² 對電源電纜貼上標(biāo)簽,在一端示出特定電纜來源,在另一端示出所指向的負(fù)載

² 對特定的負(fù)載分配特定的電源電纜,并以文檔記錄電纜分配情況

² 拆除級別較低的電源板,在機柜背面部署垂直PDU,以分配可被監(jiān)測的功率

² 更換損壞或缺失的天花板 – 這將提高氣流的效率

² 審核穿孔活動地板磚的位置。拆除損壞的磚,并更換處于冷通道內(nèi)的所有磚。

² 對地板磚上對經(jīng)活動地板引出的電纜進(jìn)行支撐的任何電纜切口進(jìn)行密封(圖7)

 

以逐漸演變作為長期的解決方案

隨著數(shù)據(jù)中心的繼續(xù)演變發(fā)展,存在著利用變更來營造秩序以取代混亂的機會。IT管理員如果面臨遺留的混亂問題,不管問題是沿襲還是自身所造成,他都必須認(rèn)識到這種不好的狀況是在很長時間內(nèi)形成的。幸運的是,導(dǎo)致形成混亂的因素也同樣給出了解決問題的辦法。

隨著業(yè)務(wù)要求推動新的解決方案和設(shè)備產(chǎn)生,它們提供了向更為穩(wěn)定、更為可靠的環(huán)境移轉(zhuǎn)的機會。在對支持任務(wù)關(guān)鍵環(huán)境的數(shù)據(jù)中心基礎(chǔ)設(shè)施方法和設(shè)備進(jìn)行選擇時,通過實施控制,IT管理員可以借助自然的設(shè)備更換和升級流程來解決遺留的混亂問題。

結(jié)論

面臨混亂數(shù)據(jù)中心管理問題的IT專員現(xiàn)在可以有一些備選的解決方案。當(dāng)今的許多技術(shù)提供了涵蓋電源、供風(fēng)、電纜布設(shè)及管理的集成式機柜式數(shù)據(jù)中心解決方案,可以在使停機風(fēng)險最小的條件下實現(xiàn)從混亂數(shù)據(jù)中心到有管理的數(shù)據(jù)中心的轉(zhuǎn)變。其關(guān)鍵在于利用IT系統(tǒng)和通信平臺的自然演進(jìn)。

可能需要一個將傳統(tǒng)的活動地板環(huán)境轉(zhuǎn)為廢棄狀態(tài)的轉(zhuǎn)移范例,而這一點采用當(dāng)今的技術(shù)很容易實現(xiàn)。IT管理員必須對行為方法進(jìn)行標(biāo)準(zhǔn)化,即建立一套對IT基礎(chǔ)設(shè)施與物理基礎(chǔ)設(shè)施均進(jìn)行管理的變更控制系統(tǒng)。只有通過對這些工具和方法的有效使用,方可從混亂演進(jìn)到有秩序。本文由服務(wù)器租用——海騰數(shù)據(jù)(http://365qv.cn)提供。

Copyright© 2004-2020 河南海騰電子技術(shù)有限公司 版權(quán)所有   經(jīng)營性ICP/ISP證 備案號:B1-20180452   豫公網(wǎng)安備 41019702002018號    電子營業(yè)執(zhí)照