ITIL:IT服务管理 “圣经”
 

2009-09-29 作者:孙强 来源:it168

 

ITIL产生的历史背景:IT运营管理方法论的缺失

自上个世纪60年代开始,IT如何高效地为人类和社会带来效率便吸引着人们的眼球。“软件危机”、“人月神话”、“软件工程”等词语便成了企业界和IT人关注的焦点。在众多专家、学者、企业人士的不断探索中,IT人创造了“OOA&OOD”、“CMM”、“IT项目监理”等我们耳熟能详的方法论。然而,在众多的方法论中,一个普遍的缺失是没有一个IT 运营管理阶段(有时又称为支持和维护阶段)的详细指南,如下图1所示。

图1 IT应用生命周期图

然而,IT运营管理并非不重要,在IT应用生命周期中,运营阶段通常有以下两个重要特点:

  •  通常时间跨度最长;
  •  业务对IT有较强的依赖性,并且将受到劣质IT服务质量的负面影响。

如图2所示,一个服务从开发到上线实施可能只需要一年的时间,却有3 到6 年甚至更长的时间来运行维护。可以看出运营阶段并非最不重要,而是非常重要,是IT应用生命周期的关键阶段,如果在这个阶段中没有任何指南作为管理参考,就有可能造成IT投资的浪费、IT 服务的不可靠、反应速度慢和质量低下。

IT服务管理的“圣经”:ITIL

在上个世纪80年代中期,英国政府意识到了该问题的严重程度,为填补IT 运营指南方面的空白,英国政府中央计算机和电信局CCTA(Central Computer & Telecommunications Agency,后来并入英国商务办公室OGC,Office of Government Commerce),发起成立专门项目,通过深入研究和总结各个组织的实际经验(最佳实践best practice),找出IT 运营管理中什么起作用而什么不起作用。CCTA 在项目进展中,结合了政府部门和企业界各方力量,同时放眼欧洲和美国(包括HP、IBM等企业)。经过几年的深入研究,CCTA发布了IT服务管理的最佳实践―ITIL(IT Infrastructure Library,IT基础设施库)。这是一套系列书籍(其中最早的一本于1998年出版),基于最佳实践,在提供符合业务部门要求的IT 服务方面,给出了通用的指导。

ITIL内容体系:两大领域、十大流程、一项管理职能

ITIL将IT服务管理分为十个核心流程和一项管理职能。这十个核心流程分别是服务级别管理、IT服务财务管理、能力管理、IT服务持续性管理、可用性管理、配置管理、变更管理、发布管理、事件管理、问题管理,一项管理职能是服务台。这些流程和职能之间的关系如图3所示。

进一步,ITIL把这11个核心流程和管理职能划分为两组:前5个流程(图3的上半部分)属于服务提供流程,后5个流程和服务台职能(图3的下半部分)属于服务支持流程。(这些流程的详细内容和具体应用我们会在后续的IT服务管理专栏中一一加以讲解) 

其中服务支持流程主要面向用户(End-Users),用于确保用户得到适当的服务以支持组织的业务功能,确保IT服务提供方(Provider)所提供的服务质量,符合服务级别协议(SLA)的要求。这5个流程属于运营层次的服务管理流程, 它们间的关系见图4。

服务台(Service Desk):服务台是一项管理职能而不是一个管理流程。它作为IT服务提供方与IT服务客户和用户之间的统一联系点。一方面当客户或用户提出服务请求或报告事件或问题时负责记录这些请求、事件和问题,尽量解决它们,在不能解决时可以转交给相应的支持小组并负责协调个小组和用户的交互。

事件管理(Incident Management):事件是任何不符合标准操作且已经引起或可能引起服务中断和服务质量下降的事件。IT 世界里的“事件”五花八门,从新进员工的email帐号的申请、机器死机、抱怨电话,到系统自动侦查到的异常状况,有时真是急如星火。而事件处理的要诀无非就是“快”——先区分事件种类、紧急及影响程度(个人or全公司?),诊断并查询可能解法,或者赶紧找专家来帮忙,反正就是“不择手段”,只求快速结束此一事件。

问题管理(Problem Management):问题是导致一些或多起事件的潜在原因,事件管理强调块,只能“治标”,虽然快速封住user的嘴巴,但其事件发生的根源(root-cause),还须进一步深入分析,才能对症下药,达到“治本”的目的。问题管理的宗旨在于找到问题的源头,积极地防止事件的再次发生。以企业门户portal为例,当使用者抱怨联机速度极慢或甚至连不上时,事件管理的处理方式可能是请网站管理员赶快清除那些已经空闲的session,好让别的使用者连进来,但是当联机量增多时,同样的事件必定一再发生,这时就得深入地“望闻问切”,发现是因为主机资源不足,可以支持的同时用户数不足,最后可通过硬件扩充,来支持更大量的用户访问,如此达到了“治本”的效果。

配置管理(Configuration Management):配置管理是识别和确认系统的配置项,记录和报告配置项状态和变更请求、检验配置项的正确性和完整性等活动构成的过程。其目的是提供IT基础架构的逻辑模型,支持其它服务管理流程特别是变更管理和发布管理的运作。如Server、CPU、Apache、Portal 等都各算是一个配置项,在配置管理数据库中(CMDB) 中不能只有简单记载,同时还必须有效呈现各CI间的关系,如“SUN-UNIX Server 有两颗CPU,上面运行Apache web server,支持portal 服务”,如此一来IT人员可通过掌握其相互依存关系,来快速了解问题,并作为变更时的参考。

变更管理(Change Management):“在竞争激烈的商业环境中,唯有‘变’是不变的真理”。为了支持企业更快速的迎接挑战,IT 得更频繁地更改其架构,或是推出新服务;从另一方面看,“变更”往往带来风险,轻则影响效能,重则造成整个IT服务的停滞;而“变更管理”的目的即在“时间”与“风险”取得平衡,既以取得完整信息及获得相关专业人员的认可,尽量降低风险;透过明确而有效率的沟通机制,加快变更确认(approval) 的脚步,不至于由于层层关卡,延误了变更的时机。以上述portal 联机问题为例,即使只是单纯的硬件扩充,仍会影响到服务,所以还是得提出RFC (Request for Change),详述其扩充原因、可能造成的影响、工作步骤及事后结果评估,获得相关人士认可后才可执行。

发布管理(Release Management):发布(版本)是指一组经过测试后导入实际运作环境的新增的或经过改动的配置项。新系统的发布,可能是企业服务的提升,也可能是灾难的开始,因此在软硬件、应用系统各方面,都需要严谨的计划,来进行测试、版本控制、部署及发布。发布管理的目的是为了保证发布的成功,主要应用于大型的或关键硬件、主要软件及打包或批处理一组变更。

图4 服务支持流程

服务提供流程主要面向为服务付费的机构和个人客户(Customer)。它的任务是根据组织的业务需求,对服务能力、持续性、可用性等服务级别目标进行规划和设计,同时还必须考虑到实现这些服务目标所需要耗费的成本。也就是说,在进行服务提供流程设计时,必须在服务级别目标和服务成本之间进行合理的权衡。由于这些管理流程必须解决“客户需要什么”、“为满足客户需求需要哪些资源”、“这些资源的成本是多少”、“如何在服务成本和服务效益(达到的服务级别)之间选择恰当的平衡点”等问题,因而服务提供所包括的这5个核心流程均属于战术层次的服务管理流程,它们的关系见图5。

服务级别管理(Service Level Management):服务级别管理是定义、协商、订约、检测和评审提供给客户的服务的质量水准的流程。有关所提供的服务和这些服务的质量水准记录在服务级别协议中。服务级别协议规定了服务双方各自的责任、权利和义务,是IT服务成功运作的重要保障。

IT服务财务管理(Financial Management of IT Services):IT服务财务管理是指负责预算和核算IT服务提供方提供IT服务所需的成本,并向客户收取相应服务费用的管理流程。IT服务财务管理流程包括IT投资预算、IT服务成本核算和服务计费三个子流程,其目标是通过量化服务成本减少成本超支的风险、减少不必要的浪费、合理引导客户的行为,从而最终保证所提供的IT服务符合成本效益的原则。

IT服务持续性管理(IT Service Continuity Management):IT服务持续性管理是指确保发生灾难后有足够的技术、财务和管理资源来确保IT服务持续性的管理流程。IT服务持续性管理关注的焦点是在发生服务故障后仍然能够提供预定级别的IT服务从而支持组织的业务持续运作的能力。因此,IT服务持续性管理必须立足于组织的业务持续性管理。

可用性管理(Availability Management):可用性管理是通过分析用户和业务方的可用性需求并据以优化和设计IT基础架构的可用性,从而确保以合理的成本满足不断增长的可用性需求的管理流程。可用性管理是一个前瞻性的管理流程,它通过对业务和用户可用性需求的定位,使得IT服务的设计建立在真实需求的基础上,从而避免IT服务运作中采用了过度的可用性级别,节约了IT服务的运作成本。

能力管理(Capacity Management):能力管理是指在成本和业务需求的双重约束下,通过配置合理的服务能力使组织的IT资源发挥最大效能的服务管理流程。

图5 服务提供流程

ITIL从战术、运营级别实现IT与业务精确校对

ITIL从战术和运营角度描述了IT如何与业务整合。在战术层,业务部门的客户需求通过服务级别管理与IT部门达成共识;在运营层,业务部门的终端用户通过服务台这一接口统一与IT部门取得联系。如下图所示。 

图6 IT与业务的整合

注:用户指直接使用IT服务的人或机构,通常是指业务部门内某个具体的职员客户指为IT服务付费的人或机构,通常是指某个具体的业务部门
                                                     

知识链接:

ITIL的基本特点

公共框架、开源标准 ITIL由世界范围内的有关专家共同开发,世界上任何组织可免费使用以及利用ITIL开展有关业务。

最佳实践框架 ITIL是根据实践而不是基于理论开发的,OGC收集和分析各种组织解决服务管理问题方面的信息,找出那些对本部门和在英国政府部门中的客户有益的做法,最后形成了ITIL。

事实上的国际标准 虽然ITIL当初只是为英国政府开发的,但是在20世纪90年代初期,它很快就在欧洲其它国家和地区流行起来。目前,ITIL已经成为世界IT服务管理领域事实上的标准。

以流程为导向,以客户满意和服务品质为核心 ITIL本质上说来是对IT部门为业务部门提供服务的流程再造,同时组织在运用ITIL提供的流程和最佳实践进行内部的IT服务管理时,不仅可以提供用户满意的服务从而改善了客户体验,还可以确保这个过程符合成本效益原则。


火龙果软件/UML软件工程组织致力于提高您的软件工程实践能力,我们不断地吸取业界的宝贵经验,向您提供经过数百家企业验证的有效的工程技术实践经验,同时关注最新的理论进展,帮助您“领跑您所在行业的软件世界”。
资源网站: UML软件工程组织