綜合佈線資料中心統籌設計技術

2022-10-01 10:36:02 字數 4898 閱讀 1326

面對未來的需求,資料中心的設計變得越來越困難。作為一種概念,統籌設計希望通過對每一位客戶的需求、可用性要求、籌資能力以及各種商業模型的評估,來滿足資料中心的需求。

在最近進行的一次調查中,要求被調查者說出所在公司對正常執行時間的最低要求。針對這一問題,大約25%的人回答,他們最低的要求是99.999%!

由此不難看出,為什麼現在大部分企業資料中心都將系統可用性看成是最主要的設計因素。與此同時,從業者和設計人員卻很難確定針對每個公司的「理想設計」。之所以備感棘手,其中涉及到諸多原因。

首要原因當屬資料中心較長的使用壽命。乙個資料中心有可能維持10年甚至更長,設計人員通常不會介入如此長的時間,來獲得確定如何改進設計所需的反饋。

與此同時,諸如微小的設計缺陷加上低劣的操作程式等各類因素也會引發很多問題。最終,也許正是由於人們對這方面了解不夠致使改進設計工作遇到困難。我們只有邊做邊學,將從修建上乙個資料中心過程中積累的經驗,應用到新的資料中心上,並加以改進。

縱觀現有眾多高可用性資料中心,每個資料中心的設計和運營模式差異巨大,但在很多方面卻又存在著相似點。通過整合各類資料中心的資料、反饋和目標,我們希望促進並協助設計或改進資料中心的過程。

本文要討論的主要問題是:

● 電源設計容量的供求不平衡;

● **未來的電源需求;

● 迅速改變資料中心的功率密度;

● 建立能夠有效分配電源的基礎設施;

● 增加新資料中心的熱限制;

● 建立和優化電源冗餘選件;

● 了解運營和培訓的影響;

● 解釋實現「99.999%」的可行性;

● 系統的恢復是如何影響可用性的。

ups供電設計容量與實際需求無法平衡

在設計和建設資料中心時,人們將**資料中心規模看成是乙個基本的程式。但是,如果**的資料中心設計壽命是10~15年,那麼這項任務就變得異常困難。在這種型別的使用壽命期內,房間內的裝置可能被新一代的裝置「重新整理」或更換四五次。

it裝置的快速更新使得最基本的未來容量**成為泡影。

例如,摩爾定律指出積體電路的整合度每18個月翻一番。對於每一代產品來說,附加的電晶體需要成比例地增加電源容量。相應地,微處理器的熱量輸出也顯著上公升。

intel最新的pentium 4晶元大約產生100w的熱量。相比486,後者發熱量不足10w。晶元密度的增加以同樣的比率增大了熱量的產生。

由此聯想到資料中心的設計,我們所看到的是,功率密度的要求在過去的幾年中迅速膨脹。不久前,每平方公尺50w還是乙個比較典型的數值,但是目前的大部分設計人員則將這一數值增大到每平方公尺150~200w甚至更多。僅僅在最近幾年中,系統基礎結構就實現了驚人的擴充套件,以應對資料中心的電源容量和冷卻不斷變化的要求。

**未來電源需要這一極富挑戰性的任務引發了最嚴重的資料中心問題之一,即ups設計容量供求的不平衡。這一問題的出現不僅影響了資料中心的效率、利用率和支援能力,而且還妨礙了資本的最優使用。例如,乙個大型資料中心建成後,經常需要2~4年才能達到或接近設計能力。

因此,在前幾年的運營中對電源容量的需求很少。而這時的使用者經常會斥資數百萬美元建設能夠達到全部設計容量的資料中心,包括購買數兆瓦的冗餘電源系統來支援資料中心。系統在以最小限度的低容量執行幾年後,才能使用全部容量。

在這種情況下,大量的資金用於最初的容量建設,以滿足多年以後才會出現的需要。具有諷刺意味的是,在使用全部電源容量的同時,資料中心仍有很大的占地面積可供使用。出現這種情況是因為裝置的功率密度在兩年內不斷增加,電源容量已被全部使用,但占地面積卻十分充足。

瞬息萬變的裝置技術使這種情況變得更糟,通常資料中心每四年就需要一次大修。除了大修的費用,資料中心的宕機風險也在實施過程中大幅度增加。

圖1 大型網際網路資料中心的利用率典型曲線

這對於以出租資料中心為主要收入**的裝置託管和網際網路服務商來說尤其危險。這些公司在正式運營以前就要支付整個設施的費用,但是與此成本對應的收入經常是在多年以後才會收到。對於這類資本密集型行業來說,在獲得收入之前承擔巨大的成本負荷是極其危險的(如圖1所示)。

應注意的是,利用率曲線可能有很大的變化,而且兩年通常是乙個非常樂觀的數字。從圖1中可以看出,供求平衡點幾乎永遠也不存在,這樣就會導致巨大的成本,無法實現最優的利用率。

圖2 可擴充套件系統中電源供求的關係曲線

圖2所示為具有更高可擴充套件性的設計方案電源供求關係。

在圖2中,系統的設計允許容量公升級。供給始終大於需求。但是這個特別的階段性設計方法也有侷限性。

由於基礎設施的變更會給資料中心運營帶來的風險,分四個階段建設非常罕見。實際上,在完成資料中心最初的建設之後,通常需要在一兩個階段內就要完成整個工程。

為了改善電源設計容量與實際需要容量間的不平衡,首先**未來的需要是很重要的。儘管困難很大,結果也總是不盡如人意,但對於長期的成功卻至關重要。其次,設計過程中需要融合以前設計缺少的靈活性和可擴充套件性。

第三,設計資料中心須注意的另乙個方面是實現解決方案的定製化,使其更加標準。這不僅可以降低設計費用,而且可以加速專案的實施。

區域性熱量增大將改變製冷系統設計觀念

另乙個與不斷增長的功率密度相關的重要問題是資料中心環境中增長的熱量。在資料中心,所有電力實際上都轉化為熱量,之後熱量又被排放回執行環境中。

多數資料中心機房製冷系統都存在各種基本的設計和配置缺陷,這可能會導致無法獲得既定的冷卻效能,同時阻礙冷空氣的流通。這些問題通常不會被發現,因為計算機機房執行的功率密度通常遠低於設計目標。然而,隨著it裝置功率密度的增加,使得資料中心機架微環境逐漸接近其設計極限,進而暴露出了無法提供有效冷卻效能的問題。

圖3 典型資料中心功率消耗分布

低效的冷卻效能除可能降低系統可用性外,還可能導致成本大幅增加。設計的缺陷可能將冷卻系統的效率降低20%或更多。圖3所示為典型資料中心功率消耗分布,冷卻系統消耗的功率接近整個it負載消耗的功率。

冷卻效率降低20%,便可能導致整個功率消耗增加8%。

要對資料中心的冷卻系統進一步優化,不僅要考慮冷卻裝置自身的設計和規範問題,還要注意整個冷卻系統為裝置提供冷空氣的過程。

事實上,不斷增加的散熱需求對於目前的資料中心來說無異於又多了乙個負擔。當環境溫度超過一定限度時會導致系統發生故障,而系統故障最終會導致意外的宕機。儘管現在的高架地板上通常可以放置新的空氣處理器,但是高架地板的高度對額外的空氣流動不利。

尤其是電源和資料電纜數量的增加以及更大的冷卻水管可能會妨礙地板下空氣的適當流動,最終導致缺少足夠的靜壓來冷卻高密度的機架裝置。解決問題的乙個辦法是在相應的裝置前增加額外的出風口。這通常可以增加該點上的製冷量,但同時也會影響其他區域的靜壓。

另乙個類似的方法是增加空氣處理器的功率。如果能夠用更大的風扇吹出更多的空氣,出風口就會得到所需的靜壓和冷卻。但是在某些的情況下,結果恰好相反。

功率大的馬達產生的流速快的氣流可能會在鄰近的出風口處產生文德里效應。文德里效應是乙個基本的空氣動力學定律。根據此定律,當流體以相對較高的速度通過乙個表面時,對表面的壓力就會降低。

文德里效應會導致某些部位致冷效果變差,使裝置執行變得不安全。過去,即便資料中心失去致冷功能1個小時甚至更長時間,也能保持安全執行。但是如今,高密度資料中心產生的巨大熱量意味著如果致冷暫停幾分鐘,溫度就會上公升,從而威脅裝置的執行。

快速散熱的要求不僅影響系統設計,而且會影響致冷裝置的維護。過去,在更換過濾器或維護空氣處理器時,出現短時間斷電不會有太大影響,但現在所帶來的危險已不可同日而語了。

圖4 熱通道—冷通道方法

因此,更高階別的空氣處理器冗餘配置變得越來越普遍。附加的冗餘配置使維護工作和裝置故障不至於威脅到整個系統。這方面,一些基本的方法已經取得了較好的效果,例如「熱通道—冷通道方法」。

該方法是一種機櫃布局方式,有助於最大限度地增加裝置機櫃入口處的冷氣量。如圖4所示。

使用這種方法,機櫃的前端彼此相對,並在相應的通道中裝有出風口。這樣就形成了「冷通道」,有助於裝置入口接受冷卻空氣。在後通道上,每個機櫃的背面彼此相對,熱空氣排進該通道中就會上公升並產生更強的對流迴圈。

致冷問題還表現在一些採用電信設計規範的資料中心。這些資料中心拆除了高架地板,在頂部使用大流量空氣處理器實現冷卻。但實際上,採用這種做法冷卻的是整個房間,而不是機櫃。

同時該方式還可能存在諸如冷卻水洩漏和冷熱空氣混合的問題。

關於系統可靠性和可用性的討論

就資料中心的統籌設計而言,必須討論的另乙個重要問題是系統的可用性和可靠性。很多客戶、設計人員和裝置提供商在談到可用性時很少採用量化的概念,也很少了解實現這些目標須採取的措施。例如當前業界使用非常頻繁的「99.

999%」。「5個9」相當於每年5分鐘的宕機時間。目標固然理想,但是要在很長時間內保持這一標準就必須滿足一些實際要求,而這些要求卻常常得不到設計者足夠的重視。

對可用性的誤解

乙個常見的誤解是可用性是在限定的時間間隔內測量出來的資料,而不是乙個連續測量值。例如,如果資料中心一年未發生宕機,但在隨後的1個月發生了1小時的斷電。在這種情況下,如果說資料中心在除了該月之外的所有月份都達到了「5個9」的可用性,那麼從技術角度來講這是不準確的。

實際上,1小時的斷電會使資料中心的可用性在12年內達不到「5個9」的目標,其原因如圖5所示。

圖5 1小時斷電對可用性的影響

可用性是在系統執行壽命期內的連續測量值,它是用總的正常執行時間除以總的執行時間得出的。通過調整時間框架,尤其是縮短所計算的時間,系統可用性目標的實現變得相對容易一些。每個月簽定的服務級別協議就是其中乙個常見的例項。

將可用性時間劃分為1個月的時間間隔可以達到高階別的可用性目標,但是相對於真正的系統可用性而言則沒有太大的意義。

在確定可用性目標時,人們很少為確定資料中心實際可能達到的潛在可用性目標而進行認真的分析。部分系統每年可能發生幾十次一兩秒鐘的斷電,1 分鐘以下的中等程度的斷電事故在一年內可能出現5~6次,1小時或更長時間的斷電可能一兩年才會出現1次。

在建立這樣乙個系統模型時,需要考慮頻度和持續時間的事件密度函式。即使5秒鐘的斷電也可能會導致發電機啟動,並影響不間斷電源電池。從根本上來說,對乙個複雜的電源系統來說,乙個5分鐘的事件與60個5秒鐘的事件之間有著巨大的區別。

與此同時,還要考慮重新啟動和恢復時間,一次1秒鐘的斷電可能會使伺服器宕機20分鐘。因此,考慮可用性時存在很多的統計屬性和非線性關係,使得這種可用性計算變得非常困難。不考慮這些電源事件因素的模型得到的結果是沒有意義的,甚至會導致錯誤的結論。

資料中心綜合佈線系統技術的幾大因素

當今世界資訊化發展日新月異,資料中心作為支援資訊化應用的核心物理平台,其建設將越來越得到使用者的重視,特別是對於金融行業,所有的日常業務執行都是依賴資料中心而存在,許多使用者不惜重金使用先進的產品與技術來建設自己的資料中心。一,結構化 在資料中心的實際應用中,由於網路的路由比較複雜,同時又要兼顧網路...

資料中心設計方案

本方案專案包括裝修工程 配電工程 空調新風系統 消防系統 綜合佈線系統 機房綜合監控工程等六大部分。本方案書根據國家標準及行業標準設計和施工。資料中心機房是基礎設施,資料中心機房的設計必須滿足當前各項需求應用,又面向未來快速增長的發展需求,因此必須是高質量的 高安全可靠靈活的 開放的。我們在進行設計...

資料中心消防裝置技術設計方案

idc資料中心機房消防系統裝置 一 產品簡介 也許網際網路資料中心機房對大家來說,是個既熟悉又陌生的地方。熟悉,因為大家知道裡面非常多的各種伺服器。陌生,大家雖然知道有網際網路資料中心機房這麼乙個地方,但它並不是一般的地方,可隨意進出,乙個正規的網際網路資料中心機房的出入是需要辦理很多相關手續的。資...