ITIL運維事件管理關鍵點有哪些?
1、數(shù)據(jù)中心事件的分類
數(shù)據(jù)中心運維過程中發(fā)生的事件種類繁多,我們主要根據(jù)故障種類以及事件定級方法,對數(shù)據(jù)中心事件進行分類。從故障角度劃分的事件包括:供配電系統(tǒng)事件、制冷系統(tǒng)事件、物理環(huán)境事件、物理安全事件、監(jiān)控系統(tǒng)、網(wǎng)絡故障、IT系統(tǒng)故障、自然災害等;結合事件定級因素,將事件分為一級、二級、三級和四級等不同的等級。有的企業(yè)會劃分為三級,有的企業(yè)會劃分為五級。表1是事件分類的一個具體實例。可以參考下面的分類實例,根據(jù)自己的情況進行事件分類的定義和等級劃分。在實際事件分類中,沒有統(tǒng)一的強制標準,是由具體的業(yè)務和管理要求決定的。可以根據(jù)定級的標準,去枚舉所屬數(shù)據(jù)中心的具體分級事件的例子。?
一級事件舉例:用戶可以根據(jù)自身數(shù)據(jù)中心的情況,定義具體的事件場景,便于判斷。
(1)供電系統(tǒng):整套供電系統(tǒng)癱瘓(雙路市電供電中斷、UPS供電中斷及發(fā)電機無法正常啟動),導致電力中斷。
(2)制冷系統(tǒng):多臺精密空調服務中斷,導致溫度、濕度超出SLA承諾閾值。
(3)物理環(huán)境:大面積的滲水漏水,導致客戶機房出現(xiàn)嚴重安全隱患。
(4)物理安全:出現(xiàn)恐怖襲擊或者有針對性的破壞而導致客戶服務中斷。
(5)自然災害:數(shù)據(jù)中心無法提供保障數(shù)據(jù)中心正常運營能力的物理指標、地震、洪水、臺風、戰(zhàn)爭等。

2、數(shù)據(jù)中心事件的升級
數(shù)據(jù)中心事件可以根據(jù)處理的不同情況,在不同的運維團隊間進行升級,表2是數(shù)據(jù)中心事件升級定義的一個實例,讀者可以參考下面的升級實例,根據(jù)自己的情況進行升級的定義和劃分,在實際事件升級中,沒有統(tǒng)一的強制標準,是由具體的業(yè)務和管理要求決定的。
對于超越一級事件的重大影響事件,如對客戶業(yè)務產(chǎn)生重大影響,嚴重影響合約的履行,有重大法律和商務風險的事件,建議高級管理層的參與,公關媒體的參與,與客戶一起做危機處理。
3、數(shù)據(jù)中心事件的記錄
數(shù)據(jù)中心事件的各種相關信息都要被及時記錄下來,一般都應該記錄在后臺系統(tǒng)里面,并且以工單的形式在各處理環(huán)節(jié)中進行傳遞。數(shù)據(jù)中心事件記錄包括很多相關信息,表3是數(shù)據(jù)中心事件記錄的一個實例,讀者可以參考下面的事件記錄實例根據(jù)自己的情況進行事件記錄信息的定義和劃分,在實際事件記錄中,沒有統(tǒng)一的強制標準,是由具體的業(yè)務和管理要求決定的。
本文摘要節(jié)選自來源于
https://www.itsmcn.com/bangzhuwendang/679.html