VMware雲計算資料中心運維管理解決方案V1

2021-03-04 09:33:14 字數 3781 閱讀 3613

1 概述

不斷增長的業務對it部門的要求越來越高,因此,資料中心需要更為快速的提供所需要的能力。近些年來,虛擬化在市場中的採用呈現穩定一致的態勢,虛擬化的比例越來越高。從虛擬化利用率的角度來講,虛擬化的發展可以分為三個階段:

第一階段為0-30% ,第二階段為最多70%,第三階段則達到 70% 以上,如下圖所示。

圖:虛擬化三個階段

而成本節約貫穿上述所有階段,第一階段通過整合在資金開銷方面實現節約,第二階段則在此基礎上通過自動化的管理模式實現了運維開銷降低,最後到第三階段,又實現了敏捷性的提高。

目前,市場上的 vmware 虛擬化程度大約在65%以上,隨著虛擬化比率的不斷提高,客戶也在不斷擴大對虛擬化功能的運用範圍,開始採用軟體定義的儲存以及網路與安全模式,從而逐步完全過渡到雲計算資料中心。

而這一轉變使得it 部門能夠轉變運維方式,從本質上被動反應也就是往往需要竭力應付業務需求並面對日益積壓的應用請求的部門,轉變為主動創新的部門,將節約的 it 資源重新投入到有助於實現關鍵業務目標的新應用、服務和計畫。主動創新的部門更能與業務目標保持一致,並且對企業的發展、創新和競爭能力起著更為關鍵的作用。

***客戶作為國內大型企業,資訊化建設不斷發展,目前資訊化網路以資訊中心為運營維護單位,覆蓋市場計費、生產經營等多套業務系統,伺服器資源龐大。雖然該客戶已經完成了對其資料中心的伺服器虛擬化改造,但是,僅僅完成伺服器的虛擬化已經遠遠不能滿足各種業務對其資料中心的新需求了,因此盡快採用虛擬化環境下運維管理解決方案已成為必須。

經過多年的發展,***客戶已經完成了資料中心的伺服器虛擬化建設,該資料中心的四台x86物理伺服器上執行著十四臺虛擬機器,負責承載人力資源、市場計費、生產經營、資產管理、網路管理、郵件、安全等業務系統,具體的虛擬機器與業務系統的分布情況如下所示。

表:***客戶資料中心業務系統與虛擬機器分布

雖然***客戶資料中心的伺服器虛擬化建設已經取得了階段性進展,但是伴隨著虛擬化程序的推進,傳統運維管理方式已經不能滿足虛擬化環境對運維管理的新需求,現有的這些運維方法在虛擬化環境下存在諸多的挑戰,使用起來顯得捉襟見肘。

現有的傳統管理工具和方法是為了支援孤立的計算環境而設計的,因此it團隊面臨著如何利用傳統管理工具和方法有效地支援新的動態it基礎設施(虛擬化環境)的挑戰,這些挑戰主要包括如下四個方面。

第一,虛擬化環境中有大量的資料需要管理,相對於物理環境而言,管理員可管理的虛擬機器數量要多出達5~10倍,伺服器和變更的數量也明顯增多。這些都使得it專業人員在嘗試部署新的虛擬化管理計畫時要面對重重困難。同時,環境中的偽警報數量大幅度增加,使得客戶非常難以應對其環境所面臨的挑戰和效能問題。

現有的運維管理方法已經無法保證管理員可以高效地管理如此大量的資料並對問題做出快速地響應。因此,新的運維管理方法需要提供整個基礎架構和應用的執行狀況、風險和效率的全面可見性,並可以提高管理員對問題的響應

圖:當前傳統運維管理方式的不足

第二,對於虛擬化平台的管理員而言,工作中遇到的問題大多是效能方面的問題,處理效能問題所花費的精力大約佔到全部管理任務的80%,要迅速定位並解決效能問題,需要高效的工具來輔助,單純地使用「紅黃綠」三色交通燈的效能指示是無法迅速地解決這些效能問題的。因此,這就需要一種主動管理基礎架構和應用效能而不是被動監控的解決方案。

第三,管理員在使用虛擬化平台時會面對兩個對立的目標:一方面,要盡可能地增加虛擬機器的密度以充分利用硬體平台的處理能力,增加投資回報。另一方面,虛擬化的主要特徵就是資源池化,資源整合以後,調配資源的靈活性大大提高,但同時也對效能和容量的管理帶來了更大的挑戰,如果不能有效地管理資源分配,則可能出現資源濫用,資源匱乏等情況。

實際的生產環境中乙個比較常見的問題就是容量「過度調配」和硬體利用率低下,它會損害組織最初在節約成本方面尋求的核心價值,同時它還會使組織無法實現最初部署虛擬化和雲計算時所尋求的敏捷性。因此,這就需要推動更高的整合率,管理員需要隨時保證業務增長對效能和容量的要求。

第四,現有的運維模式容易導致大家相互指責,同時無法迅速查明問題的源頭、在哪方面需要立即採取措施,以及如何盡快恢復服務。為了解決這個問題,新的運維管理方法應該能夠幫助管理員高效地定位問題的根源,它應該可以快速地縮小問題的範圍,迅速定位問題所屬的範疇,例如:計算,儲存,網路等。

下圖顯示的是在一項調查中,眾多已經部署虛擬化的客戶選出的他們在運維管理方面所面臨的主要難題,這項資料從另一方面展示了現有的傳統運維管理方法在虛擬化環境下存在的主要問題。

圖:虛擬化環境下運維管理的棘手問題

通過上圖可以看出,容量監控與規劃,協同合作,效能問題定位與調優以及根本原因定位是客戶在虛擬化環境下進行運維管理所面臨的主要難題。

由於傳統運維管理方法在虛擬化環境下存在上述諸多不足,因此,運維管理方面的新需求應運而生,這些需求可以從如下三個方面進行概括。

圖:虛擬化環境對運維管理的新需求

首先,新的方案應該能夠保證服務質量,能夠迅速縮短問題的平均解決時間、提高基礎設施和應用可見性、能夠主動快速解決影響業務的問題,這些都是客戶所追求的基本能力,因為這個能力直接關係著服務的質量。

其次,新的方案應該可以像虛擬化的早期階段一樣,在降低資金開銷和運維開銷方面獲得收益。這意味著該方案不僅需要優化環境中的計算資源,同時也需要優化該環境中的人力資源。

最後,現有的組織中,有很多需要竭力解決這些環境所面對的配置合規性問題,尤其是與虛擬化相關的問題。對許多組織來說,他們以前就已經碰到過這個難題,但由於部署了新的虛擬環境,並且缺少專用於這些虛擬環境的工具集,因此,如何能夠確保虛擬和雲計算環境中的合規性就成了一項主要挑戰。

vmware的雲計算資料中心運維管理(vcenter operations management suite,vc ops suite)解決方案可以幫助客戶很好地解決上述這些虛擬化環境下運維管理的問題,提供整個虛擬化環境的可見性,最大限度提高容量利用率和運維效能。除了可以解決上述這些在伺服器虛擬化後會立即顯現的運維管理問題外,從長遠來看,盡早地採用vmware提供的運維管理方法也是大勢所趨,越早採用,越早受益。

可見,無論是對眼前問題的考慮,還是著眼於長遠的效益,盡早使用vmware高效的運維管理方法都是乙個必然的選擇,而vmware的雲計算資料中心運維管理解決方案是這一選擇的最佳起點。

2 vmware雲計算資料中心運維管理解決方案概述

鑑於上述挑戰以及新的需求,vmware 推出了 vcenter operations management suite,此解決方案有助於客戶應對這些核心挑戰並滿足新的需求。

vcenter operations management suite 可使使用者更全面地了解基礎設施所有層的情況。它可收集和分析效能資料、關聯異常現象,並可識別出構成效能問題的根本原因。它提供的容量管理可優化資源使用率,基於策略的配置管理則可確保合規性並消除數量劇增和配置偏差問題。

應用發現、依賴關係對映和成本計量功能為基礎設施和運維團隊帶來了更高階別的應用感知和財務責任。

vcenter operations management suite 使 it 部門可以獲得更好的可見性和可操作的智慧型資訊,從而主動確保動態虛擬環境和雲計算資料中心中的服務級別、資源利用率優化和配置合規性,它具有如下三個基本特徵 :

◆ 自動化:根據 forrester 的調查,憑藉獲得專利的自學式分析方法,該產品可實現比傳統管理工具高得多的自動化程度,使工作效率提高近70%,資源消耗減少 30%,還可帶來更多業務優勢。

◆ 整合式:本產品採用整合式方法實現效能、容量和配置管理,以整合式套件的方式提供,它聚合了各種管理規程,並將不同基礎設施和運維部門的團隊統一成一體。

◆ 全面性:vcenter operations management suite 以開放且可擴充套件的操作平台為基礎而構建,可提供一整套全面的管理功能,包括效能、容量、變更、配置和合規性管理、應用發現和監控,以及成本計量。

借助 vcenter operations management suite,基礎設施和運維團隊可獲得全面可見性、智慧型自動化和主動式管理,從而能以盡可能高效率的方式確保服務質量。

雲計算資料中心安全策略及風險點剖析

目前,雲計算產業受到業界的極大推崇並推出了一系列基於雲計算平台的服務。但在已經實現的雲計算服務中,安全問題一直令人擔憂。安全和隱私問題已經成為阻礙雲計算普及和推廣的主要因素之一。2011年1月21日,來自研究公司itgi的訊息稱,考慮到自身資料的安全性,很多公司正在控制雲計算方面的投資。在參與調查的...

資料中心機房運維外包服務 內容

終端 終端裝置包括台式計算機 可攜式計算機 高階工作站和印表機 網路系統 網路系統包括技術中心區域網 廣域網 網際網路的維護工作 應用系統 應用系統包括資訊門戶 各類應用系統等系統的維護工作。資料中心 資料中心範圍內裝置包括伺服器 交換機 機房供電 機房空調 機房環控 機房管理 服務 5 8小時 作...

大資料中心運維服務技術方案設計

資料中心機房及資訊化終端裝置維護方案 客戶資料中心機房於xx年投入使用,目前即將過保和需要續保運維的裝置清單如下 另外,全院網路交換機裝置使用年限較長,已全部過保,存在一定的安全隱患。通過機房裝置維護保養可以提高裝置的使用壽命,降低裝置出現故障的概率,避免重特大事故發生,避免不必要的經濟損失。裝置故...