ITIL的事件管理

2021-03-03 20:31:36 字數 5168 閱讀 8813

it服務管理的質量直接影響業務的質量,進而影響企業的市場聲譽和客戶滿意度。資訊科技基礎架構庫(it infrastructure library, itil)為企業的it服務管理實踐提供了乙個嚴謹、客觀、可量化的標準和規範,是一套以流程為導向、以客戶為中心的管理方法,對it基礎架構進行全面而集中的管理,以確保企業業務的平穩、高效運營。企業的it部門可參考itil制定其it服務管理流程,從而確保企業能夠高效地實現it服務管理,為企業的運作提供更好的支援。

基於itil的it服務管理由服務台、事件管理、問題管理、變更管理、配置管理、發布管理、服務級別管理組成,事件管理是整個支援系統中的首要環節,具有應用廣、重要性大的特點。目前,我國實施it服務管理的企業中絕大部分已執行了事件管理流程。事件管理往往以快速解決表徵現象為目的,而不在於查詢根本原因,因此,時效性成為評價企業事件管理水平的重要標誌。

事件管理是it服務管理中的乙個核心流程,提公升事件管理時效性、回歸事件管理本身屬性,可以提高it服務的質量,有效改變目前我國企業普遍存在的重開發、輕運維的現象,真正踐行以服務為導向的itil理念,通過切實有效的it服務管理為企業創造價值。

一、事件管理的目的

事件是指引起或可能引起服務中斷和服務質量下降的事件,也可以是一種為個人提供特殊服務的請求。事件管理是負責解決it服務過程中的突發事件、問題以及客戶需求等內容的運維管理。事件管理中的事件是乙個廣義的概念,不是狹義的故障,它可能是軟體、硬體問題,也可能是服務需求事件。

目前,很多公司it運維管理部門沒有建立事件處理的優先順序和解決時限關聯,不能保障事件解決的實效性和it資源的有效利用,事件發生後沒有明確而唯一的責任人,缺乏有效的對事件監控和跟蹤的機制,沒有統一的it服務管理應對事件受理的介面、完整的記錄和及時反饋,缺乏事件監控和診斷等技術工具,事件不能在技術工具的支援下得到主動、快速處理。it人員工作被動,只能像救火隊一樣,不知道什麼時候、什麼地方會出現「火」情,只有當事件發生並且已造成業務影響時才能發現和著手處理。這種被動「救火」不但使it服務人員終日忙碌,也使it服務本身質量很難提高,導致it和業務部門的滿意度都不高。

因此,將it服務管理的理念和方法應用到企業資訊科技的服務管理中,是確保企業it工作發揮效益的重要舉措。企業在實施it服務管理的過程中採取的方式和程序並不相同,有的全盤開展itil所有流程,有的僅從建立服務台開始,循序漸進。事件管理流程是服務支援中的第一項流程,是在it系統遇到問題之後,解決問題的第乙個環節,與其他流程相比,它的應用最廣、重要性最大。

事件管理的目標就是對組織及使用者在盡可能小的影響情況下,使it系統盡快恢復到服務級別協議所定義的服務級別,以確保最好的服務質量和可用性級別。也就是說,迅速解決問題,將不利影響降到最低,提高追蹤和事件公升級的效率,更好地控制整個管理過程。為了實現這個目的,事件管理流程必須最佳地利用資源支援業務、開發和維護有效的事件記錄以及設計和應用統一的事件報告方法。

事件管理側重於恢復服務,為了能夠有效地解決問題,事件管理還必須對不同的事件進行分類和排隊,分類就是要分成不同的優先順序,排隊就是要識別它們。因此,事件管理的主要活動有兩個,一是對事件進行優先順序分類;二是記錄事件,把記錄下來的內容形成乙個資源庫,為將來分析挖掘知識儲備資源。

事件管理的主要任務是及時識別並跟蹤發生的事件;對事件進行分類並提供初步支援;對事件進行調查分析,識別引發事件的潛在原因;解決事件並恢復服務;跟蹤和監督所有事件的解決過程,並隨時進行溝通。因此,研究事件管理對解決目前it運維中存在的服務問題具有重要的意義,事件管理的時效性將直接影響整個企業的it服務質量和整體運營狀況。

二、事件管理的基本流程

事件管理流程大概如下:當乙個事件輸入的時候,首先要對事件進行檢查、定位。檢查事件的時候要與它不斷互動,明確它的影響範圍和緊急程度,還要進行初步的歸類評估。

服務台(servicedesk)是事件的唯一入口,它接收事件後,操作人員通過查閱cmdb〔配置管理資料庫)進行處理。具體流程如圖1所示。

▲圖1事件管理的基本流程

1.事件的查明和記錄

服務台記錄一些標識客戶的基本資訊,如姓名、工作地點、**號碼等,而事件管理記錄詳細的事件資訊,如事件發生的時間、受事件影響的服務等。這樣做的目的是便於確認事件的影響,問題管理可以根據這些資訊查詢事件原因,密切跟蹤事件進展。

首先,當使用者、服務台工作人員或其他it部門人員發現或系統檢測到某系統發生事件時,就將其報告給服務台,服務台將基本資訊輸入事件資料庫並報告給事件管理人員。通常所有的事件都是先報告給服務台,再由服務台工作人員將其輸入事件資料庫,服務支援小組是不允許直接記錄事件的。

其次,事件管理人員給事件乙個唯一的編號(事件單號),記錄一些基本的事件分析資訊(時間、症狀、位置、使用者、受影響服務、硬體等),並補充其他的事件資訊(與使用者的互動資訊和配置管理資料庫等。

再次,事件管理人員根據服務台提供的資訊和事件資料庫資訊判斷此類事件是否與已有的事件相同或類似,如果有就更新事件資訊或建立原事件的從屬記錄,並在必要時修改原事件的影響度和優先順序,如果沒有則建立新事件記錄。最後,事件管理需要判斷事件是否嚴重,如果嚴重就先向管理層報告並告知使用者有關情況,再採取進一步行動,如果不嚴重就直接進入下一步的事件初步歸類和支援。

2.初步歸類和初步支援

經過第一步的事件查明和記錄,可從使用者處獲取的事件資訊基本上已得到,事件管理資料庫已經根據這些資訊進行更新,接下來就是事件的初步歸類和初步支援。這裡強調初步,就是為了能夠盡可能快地恢復使用者的正常工作,盡量避免或者減少事件對it服務質量的影響。

歸類的目的是發現事件原因以便採取相應行動。一般來說,許多事件是重複出現的,因此,當某個事件再次出現時,只需要根據已有的經驗和措施採取行動即可:,當新的事件出現時,就有乙個與其問題和知名錯誤(知識庫)相匹配的過程,如果匹配成功就可直接用已有的方案將其解決,而不需要進一步調查,否則就要繼續進行下面提到的其他幾個步驟。

服務台如果沒有成功解決事件,就將事件轉交給二線、三線支援處理,然後負責記錄事件並聯絡各支援小組,採取必要的措施以確保使用者滿意。如果碰到未出現過的事件或事件解決過程非常複雜,就必須對事件進行調查和分析。

3.事件調查和分析

事件在第一階段和第二階段沒有圓滿解決時,專家支援小組應介入處理過程,對其進行調查和分析。

一旦事件被分派給某個支援小組,他們應當完成以下工作:確認接收事件處理任務,同時指定有關日期和時間以保障正常更新事件狀態和歷史資訊,經過服務台及時通知客戶事件最新進展,說明事件當前所處的狀態;盡可能快地把發現的權宜措施提供給服務台和客戶;參考知名錯誤、問題、解決方案、計畫的變更和知識庫等對事件進行評審;必要時要求服務台根據協議的服務級別,重新評價事件影響度和優先順序,並在必要時對其進行調整;記錄所有相關資訊,包括解決方案、新增的或修改的分類;將所有相關事件的更新、花費的時間以及處理結果反饋給服務台以讓其終止此類事件。

4.解決事件和恢復服務

在分析和調查事件後,支援小組根據更新的事件資訊,提議的權益措施和解決方案以及有關的變更請求,解決事件並恢復服務,同時更新有關事件資訊

5.事件終止

解決事件和恢復服務後,事件到達終止階段。這個階段輸入的是上一階段更新後的事件記錄和已解決的事件,採取的行動主要是和客戶一起確認事件解決是否成功,輸出的結果為更新的事件資訊和事件記錄。在事件解決後,服務台應該確保以下內容:

有關用於解決事件的行動的資訊是準確的、易懂的;根據事件產生的根本原因對其歸類;客戶同意事件解決方案和方案的執行及最終結果;詳細記錄事件控制階段的所有相關資訊,如客戶是否滿意和滿意度如何,處理事件所花費的時間,事件終止的日期和時間。

6.事件處理過程的跟蹤和監督

服務台負責跟蹤和監督所有事件的解決過程。在這個過程當中,服務台要做到以下兒點:監督事件狀態和事件處理最新進展及其影響服務級別的狀況;特別注意事件處理責任在不同專家支援小組間的轉移,因為轉移往往因支援人員的責任不明確而發生拖延;更多注意高影響度的事件;及時通知受影響的使用者關於事件處理的最新進展;檢查相似的事件,有助於保障每個事件在規定的或者最短的時間內得到解決。

我們在實際工作中還要盡量避免支援人員把過多的時間用於調查和分析而忽視使用者比較急切的需求.即本文後面將提出的事件管理問題化現象。

三、提高事件管理時效性的措施

根據事件管理的基本流程,可以從流程的每個銜接環節入手,主動管理,提高事件管理時效性,具體措施如下。

1.減少進入事件管理流程的事件數量

服務台作為it服務管理的乙個基本流程,包括呼叫中心(call-center)和幫助臺(helpdesk)以及郵件系統等,其主要職能是受理客戶需求,記錄並跟蹤事件、向客戶反饋其服務需求以及事件的進展情況,根據服務級別協議對客服需求做出初步評估,盡力解決或將其安排給有關人員解決等。服務台是服務提供方和日常聯絡處,一般作為事件的一線部門,負責報告事件和處理服務需求,同事件管理流程聯絡最為緊密。服務台要跟蹤和記錄各種事件,並負責協調二線、三線支援小組處理和解決事故。

服務台應利用既有資源,通過匹配知識庫等方法努力解決所受理的事件,提高事件的一線解決率,減少進入事件管理流程的事件數量,減少事件的不必要流轉,提高事件管理的時效性,從而提公升事件管理效率。

2.準確評定事件級別,提高事件的解決效率

在日常企業it運維過程中,有時必須同時處理數個事件,但受時間、人力、物力等條件的限制,必須對事件處理順序進行排列。這裡就必須對事件進行分級,通常可以按照受影響的使用者數、系統數以及事件的嚴重性等因素來確定事件的影響程度和緊急程度,然後根據影響程度和緊急程度來確定事件級別(見圖2),事件級別是根據事件影響程度和緊急程度而制定的處理事件的先後順序。

首先,事件管理部門可以根據事件級別的不同,優先處理高階別事件,減小其對業務的影響,避免客戶投訴等問題。

其次,可以根據事件級別的不同,針對不同級別事件建立具體的時效性指標,要求

二、三線支援部門在指定時間內完成事件的處理,並及時向客戶反饋處理結果,確保事件解決。對於服務已恢復、原因無法確定的事件應及時轉至問題管理流程處理。

3.監控事件處理過程,適時進行事件公升級管理

服務台可以成立乙個專門的事件監控小組,承擔跟蹤和監控事件處理過程的工作。當事件處理進展不盡如人意時,服務台可以根據已經定義好的公升級程式進行事件公升級。

▲圖2事件級別確定途徑

事件公升級是指一線處理部門(服務台)在規定時間內不能解決或沒有解決某個事件時,將事件轉二線、三線支援部門處理。事件公升級是根據上文提到的事件級別和事件解決時間確定的,事件公升級具體過程如圖3所示。

4.避免事件管理問題化

企業在事件管理過程中通常會出現的乙個誤區是未能分清事件管理同問題管理的區別,在處理事件過程中注重事件具體原因和解決力、法,未將恢復因此中斷的服務放在事件管理的首位,將事件管理問題化。

問題管理的主要目標是要查明事件發生的潛在原因並找到解決此事件的方法或防止其再次發生的措施,而事件管理的主要目標是在事件發生後盡可能快地恢復客戶服務,可能採取的是一些應急措施而不是永久的解決方案。事件管理強調速度,而問題管理強調質量,把速度放在第二位。為了發現事件原因和防止事件再次發生,問題管理可能需要花費更多時間解決事故且可能推遲恢復服務。

ITIL事件管理

二 業務崗位和流程角色及職責 本部分描述有關人員在參與執行和管理事件管理方案時的角色和責任。乙個角色不等於對應乙個人員,乙個人員可 以擔任多個角色。結合運維流程崗位序列及崗位說明書,依據決策管理系統的運維業務的工作內容,明確各業務崗位工作內容 以下為事件管理流程中必須具有的角色及其相應的職責 1 事...

ITIL之變更管理

ewaysun的部落格 在itil中,事件從服務台到事件管理再到問題管理是乙個解決力度逐步加強的過程,但也是乙個治標未治本的過程。要真正做到防範於未然或者減少事件影響,必須實施一定的變更以消除事件產生的根本原因。有變更必然會有風險,因此,加強對變更過程的控制,以防變更過程中的疏忽 資源短缺 準備不足...

IT運維管理與ITIL

it運維管理的由來 在企業it管理的早期,更側重於對網路 硬體等裝置的管理。那時的it管理就是通過某種方式對網路進行管理,使網路能正常高效地執行。早期的這種it管理是n 的階段,主要的面向目標就是底層的基礎網路裝置。n 系統是對網路中的底層裝置進行實時的,統一的監控,當網路中出現了問題或者即將出現問...