1 t. |& ~0 G& k. b. xIT管理其实就是服务管理,而IT服务管理的主要部分就是运维服务管理,这是用户的直接感受。并且,系统功能相对来说其实比较容易实现和考评,而保证一个长期、稳定、可持续、可评价和可调整的运维服务水平却不是一件简单的事。 3 a: [7 p4 ^" S) V1 h . G1 q* o& X$ f* A, I, |# _5 g: d
既然是服务,核心问题自然是结果的评价,所有的工作应当围绕这一目标展开,而结果评价的最终标准只能是来自客户,这样才符合面向客户,以客户为中心的原则。当然这里的客户指的是公司内部使用信息系统的内部员工,至于他们如何把服务好公司客户的目标分解到IT这部分来,那是另外一个问题。为了统一起见,在这里还是把这些“客户”称作“用户”。" I/ F# O. A* A/ w7 W6 W
1 Y( t/ L$ B( P& P0 d1 t( _
在前面的运维管理杂谈系列中我曾提到过,这种评价的标准应当是“用户能理解,IT可计算”。说要面向用户,大家都不会反对,但我们在运维管理中实际上是怎么做的?即便传统的事件分类方式是IT内部使用,与用户无关,但分级却不是如此。一般来说,传统的事件分级无非是围绕着影响地域,持续时间,业务系统等几个维度来做,不能及时准确分级暂且不说,即便做到了,这些对用户又有什么意义?用户只关心系统能不能用,好不好用,对用户来说究竟有什么影响,其他的,都是IT内部的事情。 / x& D, f1 d5 U 7 m# G. ^# p6 {1 Y! n- H5 \3 v
这样一来,如果IT拿内部的分级标准去跟用户讨论时,就会遇到不小的困难。IT说影响只有这么短时间,范围也不大,但用户可能抱怨说业务已经受到了严重影响,客户感觉很不好;反过来也是成立的,IT已经很紧张了,用户可能还没什么感觉或者虽然有感觉也以为(或“误以为”)是其他原因,并没有觉得是IT的问题。即便这些都统一了,还会出现很多相同的事件分级下用户感受不同,或者相同的用户感受中事件分级不同的情况。$ u& C9 c) q- T
. J A4 O. E W5 u5 S( B/ e' R为什么不能拿用户感受直接作为事件分级的标准?2 ]3 I$ U+ M/ F+ M+ M
8 B* m4 h$ E! C8 N
因为这用传统的方式是完全无法实现的。试想一下,一个事件产生,大家都在忙于处理,这时需要有这样一个人,他能及时对事件的本质作出明确的判断,对相似事件过去对业务的影响了如指掌,然后给事件做出正确的,面向用户的分级。且不说这样神一样的人存在不存在,即便存在,他的主要职责难道不应该是尽快去处理事件吗? 3 |4 q8 H, g! s. s# Z2 O! s * k- L' V$ Y" m. f1 ^; }但如果是用标签来管理事件情况就完全不一样了。我们完全可以和用户商定他们关心的主要指标,例如,用事件发生期间业务量的下降作为事件分级的唯一标准,5%一级,10%二级,20%三级等。当然,业务量是否真的下降,这个情况还是比较复杂的,不过我们可以用统计的方法,充分考虑历史同期的业务情况,考虑事件发生后业务回补的情况,而且这个方法还可以随着数据量的增长不断优化,越来越精确。 / k& g0 K3 K* T4 y; G% v! O , m' n$ [# i, K S- Z
这样一来,事件发生以后,所有IT人员还是各做各的,不需要增加任何新的工作量。我们所要做的,就是在系统中增加一个统计的功能,在事件结束后根据对业务量的影响给事件定级,然后把相应的数据及事件的所有标签输入数据库。这时,系统自动计算,计算出带什么标签的事件是何种分级的概率。 4 b. c: x; c( j+ y / ]4 p( J4 d j; Q; b& @当数据积累到一定程度时,就不再需要等事件结束后再给事件定级了,系统可以自动进行预测,当某些特定标签组合出现时,从历史角度来看,50%的概率是一级事件,40%的概率是二级事件……系统也可以根据事先设定好的阈值,自动提升事件级别,保证存在重大隐患的事件得到及时快速处理。做运维管理的人都知道,能够提前发现隐患有多重要,但过去来说,这些主要只能靠技术人员个人经验的积累。 7 e6 b2 t) Z; z: Y t, T , c2 }' p9 f6 D' c8 A. ~' G7 S: t4 y5 o
知识库的积累和使用也是运维管理中的一个比较大的问题。一般的运维人员,对于知识库的重要性都会认同,也愿意在事件处理过程中或结束后进行记录和总结。即便有人不习惯或者不愿意,管理者跟踪和考核也比较方便。但是,在此之后要把这些输入知识库,就不是很多人愿意了。如何保证知识库的质量和数量,以及如何事后利用,就成为始终困扰管理者的问题。类似新浪爱问,百度知道那种方式,需要投入大量的资源,作为企业来说,其实不能也不必用。9 K6 X' s8 W' L" A4 D