一、災難的定義
災難分為自然災害和非自然災害。
自然災害是指由火災、**等引發的一系列災害直接導致公司的業務中斷、電力故障、網路故障等。
非自然災害是指人為的造成的如伺服器斷電、軟體錯誤、人為故意破壞、惡意**、木馬植入、恐怖襲擊等。
二、災難恢復專案小組的制定和職能
1.管理組:統籌規劃,指揮各小組按照既定計畫進行執行。
2.部門恢復組:負責制定各部門情況制定應急備案,確定各部門資料和財產的保護方式並執行保護,確定各部門資料的恢復方式並執行恢復。
3.計算機恢復組:負責對全公司範圍內的計算機故障進行排除、恢復範圍包括系統、必備辦公軟體。
4.損壞評估組:負責對公司損失的重要資料、財務進行總體評估。並針對相應損失的財產進行彙總並結合擁有的保險進行申報。
5.安全組:負責災難發生後的人員、資料、財務的安全進行保護。並制定相應的安全策略。
6.裝置支援組:負責對公司伺服器、網路裝置、交換機的故障進行排除,制定相應解決重建方案。
7、資料恢復組:負責對公司各平台資料進行恢復,並制定相應資料恢復方案。
8、市場和客戶關係組:負責對外進行資訊發布、制定相應應急措施應對客戶疑問等。
各小組共同職能:
a) 負責計畫的執行
b) 與其它組之間進行資訊交流,監督計畫的測試和執行
c) 所有或是某乙個成員可能領導特定的組
d) 協調恢復過程
e) 評估災難,執行恢復計畫,聯絡組長
f) 監控並記錄恢復的過程
三、業務恢復流程
(一)自然災害引起的災難恢復流程
由自然災害引起的災難往往影響較大,可能會直接導致一些基礎設施的無法使用,甚至會對導致人員減少。因此對於自然災害引發的災難恢復流程相對特殊且繁瑣。
1.資料搶救
災難發生時,需在保證人身安全的情況對公司的重要資料進行搶救,搶救的範圍主要包括:記錄公司重要資訊的檔案、資料,儲存公司重要資料的磁帶,存放重要資料的硬碟、伺服器。此過程需由安全組進行統籌指揮,按照既定的計畫執行,各組成員、公司員工必須服從安全組的統一排程和指揮。
2.損壞評估及啟動應預案
災難發生後各小組需根據情況匯報損失情況給損壞評估組,損壞評估組根據彙總資訊進行訊息告知披露。披露損壞資訊包括:
a)公司重要生產、監視測量、辦公裝置
b)擁有在可以執行計畫之內的關鍵性功能的員工
c)儲存公司重要資料的介質
d)網路、通訊裝置
各小組人員根據披露的損壞資訊情況進行應急預案啟動,如選舉臨時領導、使用備份伺服器、備份通訊裝置進行替代等。
3.業務恢復計畫
業務恢復計畫需要多個小組支援與配合,總體可劃分為以下幾個階段:
a)it基礎設施恢復階段:
此階段主要的目標是將對於儲存資料的基礎設施、業務系統所在的主機、公司網路架構進行恢復。首先須根據損失評估小組給出的報告分析可繼續利用的it基礎設施,如供電設施、交換機、伺服器、防火牆等。若有損壞不可用的裝置,需及時同**商進行溝通借用或新購相應裝置。
此階段由裝置支援組執行。
b)系統恢復階段:
系統恢復主要針對關鍵應用主機,如rasd-server、ibm、center-server、bjtct。為節約時間需同時針對各個伺服器系統進行快速恢復。此階段由資料恢復組執行。
c)網路恢復階段:
網路恢復階段的主要針對以下幾點進行:
● 關鍵商業應用系統的內部區域網和網路裝置的支援
● 外部廣域網和電信服務
● 待恢復系統和終端使用者(公司同事)間的通訊
此階段由資料恢復組同裝置支援組共同執行。
d)業務平台恢復階段:
在此階段的恢復工作主要圍繞日常工作常用的業務平台進行,常用的業務平台主要為:winmail、change、doors、synergy、oa、erp等。平台恢復的工作分為兩個部分:
● 業務系統資料恢復
● 業務系統重搭建
● 業務系統資料匯入
業務系統資料恢復:
資料恢復小組首先須對業務系統的資料進行恢復,需要尋找相應的恢復裝置完成此操作,目前我們主要利用磁帶機和可正常工作的主機進行資料恢復工作。需要將搶救出的磁帶和硬碟接連在對應裝置上恢復出資料。
業務系統重搭建:
為提高業務恢復效率,資料恢復小組成員需分工協作,共同完成業務系統的重搭建工作,由於一些業務系統的特殊性,需盡快與相應平台的**商介面人取得聯絡,並申請臨時可用的加密狗、許可檔案等。各個平台負責人需對自己管理的平台在短時間內進行重搭建。
業務系統資料匯入:
資料恢復小組成員需根據匯出的資料結合自己管理的業務平台進行資料匯入,並測試可行性。再匯入成功並可使用後及時同個小組成員負責人進行通知。
(二)非自然災害引起的災難恢復流程
非自然災害引起的災難恢復通常破壞較小,但是風險程度仍不可忽視,如電力故障導致的關鍵業務系統無法執行同樣會給我們的公司帶來一定的影響。但由於破壞程度的不同,我們將引入業務持續計畫(bcp)這樣乙個概念。
業務持續計畫是為了防止正常業務行為的中斷而被建立的計畫。當面對由於人為造成的故障或災難以及由此造成的財產損和正常業務不能正常使用時,bcp主要被設計用來保護關鍵業務步驟。bcp是最小化對於業務的干擾效果和使業務能恢復正常執行的計畫。
rto (recovery time object)恢復時間是指eia部門同公司簽訂的故障響應恢復時間,如確保在1小時內排除故障,使業務系統重新恢復工作。
rpo (recovery point objective)恢復點目標,該指標規定在災難發生後,公司所能夠容忍的資料丟失量,該指標由eia部門同公司簽訂。
對於rto和rpo目標的實現,需要人力、物力的支援,因此對於高效,最小化的bcp指標,往往也會花費大量的財力資源。在執行業務持續計畫的同時,由於造成的災難和破壞性並不嚴重,因此可直接進入業務平台恢復階段。
賽門鐵克sepm關與災難恢復
關於災難恢復 災難恢復的內容包括下列主題 如何為災難恢復做準備 關於災難恢復程序 還原 symantec endpoint protection manager 還原伺服器證書 還原客戶端通訊 如何為災難恢復做準備 若要執行災難恢復,您必須為災難恢復做準備。必須在 symantec endpoint...
SQP QP 0715業務持續計畫和災難恢復計畫 生產部
業務持續計畫和災難恢復計畫 檔案編號 qp 0715制訂單位 生產部版本版次 a 0編訂日期 2016 03 05生效日期 2016 03 05 序號1234 分發部門管理者代表生產部採購部業務部 分發份數1份1份1份1份 序號5678 分發部門品質部人事部工程部倉庫 分發份數1份1份1份1份 制訂...
交易系統災難恢復演練測試方案
一 參測單位 1 深圳 交易所 2 上海 交易所 3 中國結算深圳分公司 4 深圳 通訊公司 5 各會員及相關單位 二 測試內容 1.交易及非交易委託報盤測試 2.交易所模擬交易系統出現災難故障切換至異地備份主機,檢驗技術系統對災難事件的應急恢復處理能力和驗證交易系統災難恢復的正確性 3.驗證交易系...