[容错系统意义及其在钢铁厂的应用分析]容错机制的意义

  摘 要 互联网的广泛应用,电子商务系统接通全球市场,信息成为企业生存的关键资源。电子商务系统一旦涉足全球市场,就可能遇到急剧增长的信息,即使是对最坚固的平台来说这也是一个严峻的考验,因此随之而来的对信息系统的安全保障已成为普遍关注的问题。了解容错技术的发展有助于对Stratus容错服务器的利用。本文主要对容错技术在钢铁企业中的应用问题进行了分析,希望能够产生积极的影响。
  关键词 容错技术 服务器安全 应用
  一、容错技术的意义
  容错的含义比较宽泛,这种不确定性容易引发歧义,增加理解上的难度。从概念上来说,容错是指服务器对于错误的容纳能力,是应用过程中对于服务器稳定性追求的一个目标。服务器的容错技术一般是指由于种种原因在系统中出现了数据、文件损坏或丢失时,系统能够自动将这些损坏或丢失的文件和数据恢复到发生事故以前的状态,服务器还具备继续工作的能力,使系统能够连续正常运行的一种技术。容错系统一般有两种,既有因具备热备份方案而允许出错的系统,也有对出错非常敏感的系统。这里的“出错”既有人为因素,也有非人为原因。
  虽然在一般情况下,信息系统的故障不会给企业运作带来什么影响,但在某些关键时刻,系统的故障就会给企业带来不可挽回的影响和损失,这对医院、报社、工厂、金融机构等而言,尤其重要。容错技术的产生和应用正是在这种客观需求下应运而生的。容错技术的逐步成熟,使得具备容错功能的服务器具备了更高的可用性和可维护性,而且容错服务器还可以降低用户的总体拥有成本,更多的企业开始把目光从双机热备转向了具有容错技术的服务器平台。
  具备容错技术的服务器是通过对服务器的关键部件采用冗余配置的模式,当出现操作失误或系统故障时,服务器的容错机构可以及时发现、及时补救所出现的系统故障,以保护文件、恢复并保持系统的正常运行。而专业的容错服务器则能够自动分离故障模块,在不中断运行的情况下,进行模块调换,对损坏的部件进行维护,并且在一切物理故障消除后,系统会自动恢复同步运行。容错服务器在“可靠性、可用性、可管理性、可维护性、可兼容性、可扩展性”等设计方面得到了更好的保障。
  二、如何保护服务器
  在容错服务器领域,通常采用以下三种方式保护服务器,一是把两台服务器共享磁盘阵列柜做成集群,二是在两台服务器间安装双机容错软件,三是单机容错。它们各自所对应的容错级别也是从低到高的,也就是说,服务器群集技术容错级别最低,而单机容错技术级别最高。
  (一)双机热备份技术所采用的是两台配置完全一样的服务器系统,操作系统的应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是通过磁盘整理集中管理和备份数据的。数据集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备读取和存储,并由专业人员进行管理,保护了数据的安全性和保密性。
  (二)单机容错服务器则是通过CPU时钟锁频,通过对系统中所有硬件的备份,包括CPU、内存和I/O总线等的冗余备份,通过系统内所有冗余部件的同步运行,实现真正意义上的容错。任何系统部件的故障都不会造成系统停顿和数据丢失。
  (三)双机热备的容错模式和单机容错服务器的定位稍有不同,双机热备一般可以实现99.9%的可用性,单机容错却可以实现99.999%的可用性。这样,双机热备份大多应用在业务连续性不是很严格的行业,比如公安系统或者个别的制造企业,这些行业的应用允许数据有一小段时间的中断。而如电信、金融、证券和医疗等要求高的行业则是容错服务器的天下。
  另外,双机热备容错方式由于至少需要2台服务器,导致在软件采购(操作软件、中间件、双机备份软件等)、系统维护升级、系统硬件升级都需要比单机容错方式多1倍的额外投入,而且在双机热备份软件出现故障时,其维修的难度较高,会给客户带来较大的困难。因此,虽然单机容错服务器的硬件成本高于双机备份方式的硬件投入,而其总成本却远远低于双机备份方式的成本。
  三、容错系统应用
  进入21世纪以来,制造、中小企业、能源、交通等领域对服务器,特别是中低端IA服务器的需求激增,过去仅仅可以应用在RISC平台、HP-UX环境下的容错产品也面临着新的挑战。另一方面,企业越来越依赖信息系统来完成关键业务的应用,同时他们不可能配备更多的专业人员来进行专职维护。双机热备、集群服务器遇到难题。尤其对24小时不间断,长期工作负责核心的服务系统,需要具备容错服务。
  在炼钢的L2控制层当中,采用的是四台Stratus容错ftServer4300服务器,分别作为预处理、电路/转炉、炼炉及连铸数据库服务器,容错服务器的二级PCS系统具备如下特征:
  系统开放性:容许哦服务器一般应用的是工业行业标准设计,系统具备良好的开放性,采用的是RedHat Linux操作系统,数据库应用的是oracle,今后软件的移植、系统的升级均很方便。
  系统的可靠性:容错服务器应用部件级冗余,因此关键的核心组件都是冗余的,采用美国容错公司的专有的硬件时钟同步技术,冗余的容错硬件的部件在同一时钟周期下执行相同的运算,在一个部件出现故障的情况下,其冗余部件就像激活了备份一样,继续正常工作;服务器系统的零切换时间保证了实时数据的完整性和可靠性,结合容错的故障安全软件及主动服务体系结构,从而保证了系统的99.999%的可用性。
  经过对于现有硬件平台的分析,钢铁厂热轧生产线二级过程控制系统与数据库系统选用了Stratus ftServer容错系统。此系统应用的是紧密封装的机架或机柜配置,且第三代容错系统继承了ftServer技术的可靠性,再加上精细的行业标准模块化部件设计,结合相关操作系统的可用性、高性能、安全特点,这样完全能够满足生产的需要。
  参考文献:
  [1].韩晓娜.陈朝旭.缑林峰一类传感器故障的主动容错控制西北大学学报(自然科学版)2010(1).
  [2].孙发;刘枫基于OPCUnifiedArchitecture的服务器研究仪器仪表标准化与计量2006(05).

推荐访问:容错 钢铁厂 意义 分析