• 公司简介 企业文化 价值观念 企业荣誉 工厂实景
    UPS不间断电源 逆变电源 铅酸免维护蓄电池 EPS应急电源 模块化在线式UPS 电力专用UPS UPS电源通讯选配
    公司新闻 行业动态 新品促销
    模块化UPS解决方案 冗余并机解决方案 单机运行解决方案 双总线模块化N+X解决方案 双总线N+1解决方案 电力行业解决方案
    售后服务 软件下载 在线支持 UPS电源报价
    专业知识 常见问题 电源名词解释

    地址:东莞市莞城区东城西路城市花园商贸大厦A座1106
    电话:0769-22323936
    传真:0769-22475353
    联系人:阳先生 15814169797(东莞)
    徐小姐 18902697919(东莞)
    邹小姐 15920656519(东莞)
    邮编:523000
    邮箱:smart-vivian@163.com

    || 您现在的位置:东莞鸿驭电源 >> 首页 >> 文章详情

    文章详情

    供电系统的模块化设计与模块化UPS
    发布时间:2012.11.08  新闻来源:东莞市鸿驭电源有限公司     [ 返回 ] [ 打印 ]

     

    摘 要

    系统模块化是数据中心基础设施设计的重要理念和基本策略,数据中心设计建造中的很多问题都与系统模块化程度有关。模块化以及与之关系紧密的标准化,为数据中心带来了广泛的好处,它不仅简化了从初始规划到日常操作的每一个流程,还显著改进了数据中心商业价值的所有三个主要组成部分 – 可用性、适应性和总拥有成本。 模块化 UPS 是可用性级别最高的模块化系统,引领着数据中心基础设施设计建造的理念和方向。

    关键词:数据中心、系统模块化和标准化、模块化UPS

    一、可修复和可快速修复功能是提高系统可用性的关键

    现代数据中心基础设施设计和运行的一个最基本也是最重要的要求是系统必须能连续工作。而工作连 续性的程度通常是用系统的可用性来描述的。系统可用性 A(t)的定义为:电子系统在使用过程中(尤其在 不间断连续使用的条件下)可以正常使用的时间与总时间之比。可用性是由可靠性参数MTBF(平均无 故障时间)和故障后平均修复时间参数 MTTR 表示的,即:

    可靠性MTBF愈高,系统的可用性愈高,这是不言而喻的事,但设备的可靠性是有限的,特别是由若 干不同功能不同厂家的设备组成的复杂的系统,可靠性很难达到设计要求的水平,使数据中心基础设施特 别是供电系统变得很脆弱。于是,设计者和用户很自然的想到必须从系统的可修复和可快速修复上找出路, 因为尽管系统和设备的可靠性达不到要求的高度,故障随时都可能发生,但只要系统中的所有设备故障后 都是可修复并可快速修复的,故障后平均修复时间MTTR数值很小甚至趋近于零,那么系统的可用性同样 可以很高。

    可修复和可快速修复成为数据中心用户和设计者在系统设计时追求的首要目标。只要组成系统的所有 具备独立功能的子系统,在系统投入运行后都是可拆卸、可移动、可更换的,那末这个系统必然是可修复的。

    可快速修复通常指可无工具拆卸和可拔插更换子系统和设备。但是,如果功能相同的两个设备可冗余 配置,当一个设备故障停止运行后,另一个与之冗余并机的设备可继续工作而保证系统正常运行,那末, 对于整个系统而言,我们可以认为冗余并机环节没有发生造成系统宕机的故障,可靠性很高;也可以认为 虽然设备发生故障,但是在修复过程中没有影响整个系统正常运行,修复时间为零。

    以上设计理念已在数据中心基础设施用户和设计者中取得了最广泛的共识,并在系统方案设计和建造 中取得了广泛的应用和显著的效果。

    二、"系统模块化"是可修复和可快速修复的根本条件

    我们把具有独立功能,在系统中可整体安装、拆卸、移动、更换的子系统称之为模块,那么上面的设 计理念可概括为以下三句话:

    1、现代的数据中心要求基础设施必须是一个能连续工作的系统;
    2、一个能连续工作的系统必然是可修复和可快速修复的系统;
    3、一个可修复和可快速修复的系统,组成该系统的所有子系统必然要具备模块化特征;

    模块化即将完整的产品或流程按功能分成小块,即模块。根据上面讲的,模块的特征应该是: ?

    模块是系统中一个具有独立功能和可独立运行的单元;
    结构上可整体安装、拆卸、更换、移动;
    相同单元可冗余并机运行。

    在系统中,根据需要对这些模块进行组装,以产生原始产品/流程的各种变体。以我们很熟悉的手电筒 电池为例:可以将不同数量的电池(模块)进行组合,从而获得不同功率的电源。在 IT 设备中,刀片式 服务器和 RAID 阵列也是模块化的典型例子,将多个设备组合在一起获得不同数量的服务器或不同大小的 存储容量。模块无需完全相同:以 Lego? 积木为例,这些模块在某些方面相同,某些方面却不同,譬如, 其颜色、大小和形状各不相同,但连接方式和尺寸均采用标准形式,以便可以将积木(模块)组装成一个 集成系统。不同的模块化系统可以根据所需的功能划分目标,将不同数量的相同模块或不同模块(表示不 同的标准化级别)并入集成的模块或系统中。

    数据中心基础设施是集成了多种功能的复杂系统,需要进行仔细的工程设计,以按照在标准化级别与 用户灵活性之间取得最佳平衡的方式进行模块化。系统中存在各种级别的模块化设计的可能性。下面是一 些示例: 

    可互换的 UPS 功率模块和电池模块:在功率、冗余程度和运行时间方面均实现了可扩展性,而 且能够进行热插拔,从而在不需要停止系统运行的条件下进行维修;
    标准化的模块化布线:将房间布线细分为行级模块或机架级模块,避免了混乱并易于出错的布线 状态,并简化和加速了断开-重新排列-重新连接的流程。模块化配电系统的方式很多,可以采用为 整行负载供电的机架大小的模块化设备,也可以采用服务于单个机架的电源插板(机架PDU);
    机架级通风装置:将房间气流细分为各机架局部控制,以便对高温区域进行精确制冷;
    高密度机架系统:将机架、配电系统和制冷系统集成为一个独立的封闭"空间",以冷却和隔离发热 量密集的 IT 设备(此时,"模块"指集成的整个系统)。

    根据模块的特征,在数据中心基础设施中,一根线缆、一台整机UPS或空调机,都是一个模块,但是 由于设计的疏忽,有时它们在系统中却失去了模块化功能:一根线缆可能因为数量多并相互挤压而无法识 别和更换,以至于一个老鼠啃坏一条线缆的绝缘就会使系统瘫痪而且不能迅速恢复;一台大型UPS或空调 机因走道空间狭窄或搬运工具进不去而不能运出更换;一台装入机柜的变压器故障后因工具无法在机柜内 施展而无法更换等,这些事例屡见不鲜,使具有这种隐患的系统也就不再具备可修复或可快速修复的功能。

    这里引伸出的是一个新的概念-系统模块化概念。在一个复杂的系统中,尽管组成系统的所有子系统都 是模块化的,但是由于缺乏系统模块化设计,使部分模块失去可更换、可移动的功能,最终使整个系统变 成一个不可修复或不可快速修复的系统,可用性大大降低。

    "系统模块化设计"已经成为数据中心设计建造必须遵守的原则。模块化使一切事情变得更加便利、更可 预测、更为经济、更易于理解以及更加安全。"系统模块化设计"观念在行业中已上升到一个新的高度,成 为了一种富有创造性并具突出战略意义的设计哲学。

    三、模块化系统的优势

    从上面所述可知,模块化系统设计是建造可修复和可快速修复系统的基础,采用标准化结构和连接方 式的模块化组件使一切变得更容易、更迅速,且成本更低。从供应商的制造与库存,到设计与工程规划过 程,再到客户现场的安装与运营,无不如此。以下几点突显了模块化系统的优势: ?

    模块化系统是可扩展的:模块化的基础设施可以根据当前的 IT 需求进行部署,并且能在以后根 据需要添加更多组件,这种"系统规模块化"能力显著降低了总拥有成本;
    模块化系统是可更改的:在系统中可通过模块的重新配置,为满足不断变化的 IT 需求提供了极大的灵活性;
    模块化系统是可移植的:在安装、升级、重新配置或移动模块化时,独立组件、标准接口以及易 于理解的结构既节省了时间又节约了资金;
    模块化组件是可替换的:发生故障的模块可以很容易被换下,以便进行升级或修理,而且通常无 需停止系统运行;
    模块化可提高故障修复的质量:模块的可移植和可插拔特性使得很多工作可以在工厂进行,既包 括交货之前(如配电设备的预先布线),也包括交货之后(如电源模块的修理)。从统计学角度 上分析,同样的工作,在工厂内完成要比在现场操作的再故障率低得多,例如,与在现场修复的 UPS 电源模块相比,在工厂修复的模块在引起断电、发生新的故障或无法恢复到满负荷工作状 态方面的概率要低上百倍。

    模块化是标准化的基础,是标准化不可或缺的基本条件。几乎所有好处都能以某种方式追溯至标准化 的两个强大的基础属性:模块化构件结构和提高的人类学习能力,如图1所示。

    模块化UPS结构

    正是这两个特征产生了遍及整个基础设施的好处,为基础设施的几乎每个方面带来了累积的正面影 响。

    人类学习-理解的力量:
    模块化提高了设备的效率,易于理解性则提高了人的效率。模块化标准化系统在各个层面上使人类的 学习更加方便。事物不仅更易于理解,而且可预测性和可重复性也更强,因而发生问题的概率更低,并且 当发生问题时更容易识别。

    事物越易于理解、可预测性越强,便越容易解释、编制文档、操作、查明问题并修复。这些效应往往 互为基础,从而使安装、维护工作可以做到:
    减少人为错误:标准化对于人类学习最突出的贡献莫过于减少了数据中心中的人为错误,从标准 化模块化组装流程到系统的故障诊断、文档编制、培训等都更加简单、有效,从而使员工更熟练、 更不容易出错;
    预见问题:对工作原理的了解,再加上此类事物的标准化程序(如设备监控和预测性维护程序), 形成了一个足以应对那些"意外"事故的强大防御手段;
    提高效率:由于这些学习效果相互影响并互相推动,效率得到了全面提高。员工的知识越全面, 在相关问题上所花费时间的利用率就越高。人为错误的减少不但减少了在纠正人为引发问题上所 需的时间,而且也减少了答复与此类问题有关的电话帮助热线的时间。使人力资源得到更好地释 放和合理使用;
    批量生产的优势:部件和流程的标准化模块化使批量生产成为可能,批量生产的优势体现在以下 几个方面:成本更低、质量更高、更易于维修、产量更大、交货速度更快。

    四、模块化系统对基础设施商业价值的贡献

    如何衡量和评估数据中心基础设施的商业价值?由于基础设施的主要功能是确保 IT 设备的持续运 行,所以其商业价值有三个因素组成: 

    可用性:可用性越高,商业价值也越高;
    适应性:快速响应变化的 IT 需求成为能否实现数据中心的设计功能和预期目标的关键;
    总拥有成本:在使用寿命期间购买和运行的总成本。
    这三个组成部分与商业价值的关系如图2所示。

    数据中心基础设施的商业价值

    能够提高可用性和适应性并降低总拥有成本的事物即是基础设施商业价值的驱动因素。在这种客观的 因果关系中,标准化和模块化所产生的好处可同时驱动所有这三个"性能参数"。

    1、模块化和标准化对提高可用性的作用:

    模块化和标准化对提高可用性的作用表现在提高设备可靠性、降低平均修复时间、减少人为错误等三 个方面。

    (1)提高设备可靠性:

    标准化模块化可明显地提高设备的可靠性:
    批量生产可降低了生产缺陷;
    模块化组件可以返回制造商处进行维修,可极大地提高了维修质量;
    采用标准化连接的模块化系统可以按照与现场同样的方式在工厂内进行配置,因而可以在工厂内进行 预先调适和测试,以发现缺陷;
    标准化的模块化组件更易于实现内部冗余配置以及热插拔更换功能;
    采用标准化的设备监控系统后,可以更方便地进行前瞻性维护,以便在逐步演变为重大损失之前识别 问题;
    降低对容易出现人为错误的预防性维护的依赖性。

    (2)降低平均恢复时间 (MTTR):

    模块化标准化对降低平均恢复时间 (MTTR)是最明显不过的:
    模块的热插拔功能可以迅速将发生故障的模块化组件拔下,以进行更换,因此,不存在因等待修理而 耽搁系统恢复的情况;
    模块化标准化令系统更容易理解与操作,加快了问题的诊断速度,并提高了用户自己进行诊断与更正 的可能性。

    (3)减少人为错误:

    迄今为止,在提高可用性的所有途径中,减少人为错误是最行之有效的手段。随着设备与程序的模块 化标准化,功能更加透明,日常操作更加简单并更容易学习,一切事物都按照预计的方式运行 – 所有这 些,都降低了发生从输入错误命令到拔错插头的任何故障的可能性。

    2、模块化和标准化对提高适应性的作用

    模块化标准化对提高适应性的作用表现在加快部署速度、增强可扩展的能力;增强可重新配置的能力 等三个方面:

    (1)加快部署速度:

    模块化标准化可明显地加快部署速度:
    加快规划与设计速度,可根据设计目标以合理的方式配置系统结构,包括模块单元的物理排列,仅选 用满足当前 IT 需求的设备数量与类型;
    模块化结构所固有的设计灵活性,可及时地满足特殊的基础设施需求;
    标准化批量生产的设备可以实现现货供应,因而提高了交货速度;
    标准化的连接方式可减少现场配置与连接的工作量,加快安装速度;
    标准化模块可以采用与现场一模一样的方式在工厂进行连接并预先测试,系统的调试速度也提高了;
    仅根据当前的 IT 需求进行设计,因而只需部署比典型的传统系统设备数量更少的小型基础设施,进 一步缩短了各个部署阶段所需的时间。

    (2)增强可扩展的能力:

    采用模块化构建模块化的结构,系统功能可以逐块获得,因而可使从配线柜到大型数据中心的任何大 小的 IT 空间的配置达到最佳状态。更为重要的一点是,可以只按照启动时所需的 IT 需求来设计相应的 基础设施。而后,随着 IT 需求的增长,可以添加更多的构造模块,而无需重新对整个系统进行工程设计, 也无需关闭关键设备。这种"系统规模优化"策略显著降低了数据中心在使用寿命期间的成本。

    (3)增强可重新配置的能力:

    IT 的更新周期通常为二年至三年,因此,重新配置、升级或移动能力在基础设施适应性中占据着重要 的地位。模块化组件可以拔下、重新排列并重新连接。除了因商业需要而进行的重新配置之外, IT 设备 的功率密度随着其物理尺寸的不断缩小(如刀片式服务器)而稳定增长,因此,也需要定期重新配置机架、 供电系统和制冷系统。此外,可热插拔的模块化组件为重新配置不同级别的冗余、不同电压或不同插头类 型提供了可能性。不仅是模块化结构简化了断开连接、移动并重新连接这一物理过程,除此之外,制造商 对设备模块化的仔细设计也将重新设计的需要降至最低,并最大限度地提高了将现有设备重复用在新配置 中的能力。

    3、模块化和标准化对降低总拥有成本的作用

    模块化和标准化对降低总拥有成本的作用表现在降低投资成本、降低非能源运营成本、降低能源成本 等三个方面:

    (1)降低投资成本:

    标准化的模块化结构从以下两个主要方面降低了投资成本:
    采用模块化结构后,基础设施的大小紧密配合当前的 IT 需求而规划,而不是根据最大的规划需求来 构建初始容量;
    简单明了的结构简化了从规划到安装的整个部署过程中的每个步骤,这种简化不仅缩短了每个阶段所 需的时间,而且往往减少了寻求外部帮助的需要。例如,机架级的标准化的模块化配电系统即从可扩 展性和简单性两方面节约了成本:可以只为安装的机架部署电源和电缆,而无需为整个房间布线,因而减少了工作量。同样,集成了电缆与空气流通装置的标准化的模块化机架设备为基础设施提供了可 扩展性,并简化了设计和安装过程,将设计咨询和定制安装服务的需求降低最低。

    (2)降低非能源运营成本:

    设计变得简单、易于学习,意味着培训的效率可以更高,运营/维护程序也可以更高效并减少出错的几 率。标准化模块化设备与程序的更易于理解,也意味着更多的维护工作可以由 IT 人员来完成,而无需供 应商提供维护。采用标准化的设备监控系统后,借助于易于掌握的管理工具,可以更方便地进行预测性维 护,以便在逐步演变为重大损失之前识别问题。标准化的模块化组件可以直接拔下以进厂维修,这比在现 场维修更为可靠,成本也更低。由于可用性的整体提高,寻求热线帮助以解决与停机有关的问题的需求也 大为减少了。

    (3)降低能源成本:

    数据中心在使用寿命期间的电力成本是 TCO 中最大的一项。按照现有的 IT 需求规划基础设施,并 根据 IT 需求的增长添加新的组件,这种方式使用户只需为所需的设备提供配电和制冷。在数据中心的使 用寿命期间,因此而节约的电力成本非常可观。模块化UPS 设计使得UPS 的容量与负载需求更为匹配, 从而提高了 UPS 的工作效率并减少了实现冗余所需的 UPS 模块的容量。模块化制冷设计,如基于机架 的空气分配单元,使气流组织更准确,从而提高了制冷效率,进而减少了制冷设备所消耗的能源。

    五、"模块化UPS"是最高级别的模块化系统

    前面讲到可修复和可快速修复功能是提高系统可用性的关键,"系统模块化"是可修复和可快速修复的 根本条件,而UPS又是整个供电系统中可靠性最薄弱的环节,于是,数据中心设计者首先把模块化设计理 念用在UPS供电系统的设计中,把冗余容错和插拔修复技术同时应用到一台UPS中,这就是当前已在市场 上广泛推广应用的"模块化UPS"。

    1、"模块化UPS"是最高级别的模块化系统

    系统的冗余程度差别以及是否有插拔修复功能,决定了系统的可用性级别,根据前面的介绍,我们可 将模块化系统分为四个等级,如图3所示。

    (1)模块化系统:系统中的所有子系统都具备模块化特征,例如供电及制冷设备、线缆、配电开关等 都有独立的功能,且在结构上可整体安装、拆卸、更换、移动;

    模块化系统的四个等级

    (2)具有插拔功能的模块化系统:系统中关键的子系统具有插拔修复功能,例如扩容模块化UPS、保险 丝、无工具安装线缆及其它有可插拔安装功能的模块化子系统;

    (3)具有冗余容错功能的模块化系统:系统中关键的子系统具有冗余容错功能,例如(N+1)UPS、(N+1) 空调及其它有冗余配置功能的模块化子系统;

    (4)同时具有插拔功能和冗余容错功能的模块化系统:系统中关键的子系统同时具有插拔修复功能和冗 余容错功能,例如(N+1)模块化 UPS

    显然,模块化UPS设备属于第四级,由于系统中的关键子系统同时具有插拔修复功能和冗余容错功能, 在下面的分析中可以看出,它的可用性可以达到很高的水平。

    2、模块化 UPS 的系统配置及运行模式

    模块化 UPS 可以认为是一个具有多重冗余结构的可扩充的模块化系统,图 4 是其结构示意图。

    模块化 UPS 系统结构示意图

    系统主要包含以下组成部分:输入配电、输出配电、N+1 功率转换模块、N+1 电池模块、1+1 控制管 理模块、集中静态旁路、维护旁路。

    功率模块在物理结构上是一个完整的可插拔更换的单元,应具备完整的 AC/DC 和 DC/AC 转换以及 不停电供电控制功能,在配置输入输出配电和相应电压的电池后,就是一台 UPS;

    把电池分组是为了实现冗余功能,总容量由整台模块化 UPS 设计容量确定,在物理结构上每组电池 构成一个独立的可插拔更换的单元;集中静态旁路在物理结构上也是一个可整体安装更换的单元,其容量 等于整台模块化 UPS 设计输出容量;

    控制管理模块也是可插拔安装更换的,其功能主要有三个:第一个是整个系统工作状态信息的收集, 如输入、输出电压等;第二是整个系统功能的控制,如系统并联逻辑控制,切入、切出旁路等;第三是作 为系统与外界通信的接口。

    模块化 UPS 的运行模式和控制过程有以下六种情况:

    (1)正常运行:所有模块的整流单元并联运行,将输入交流电转换为直流电,再向逆变单元供电的 同时保证电池组的浮充。所有的逆变单元并联运行,将直流电转换为高质量的交流电输出输出,电压同频、 同相位、同幅值,均分负载电流;

    (2)市电正常,如果一个功率模块发生故障,在智能管理模块的并联逻辑控制命令的调控下,自动 将该功率模块关机的同时,把该模块输入输出主电路的继电开关断开,系统继续正常运行,负载由并联的 其他功率模块供电,只不过系统不再具备冗余功能。此时系统给出报警信号,已从系统脱开的功率模块可 用插拔方式在数分钟内更换;

    (3)市电正常时,在系统中已有一个功率模块因故障而处于离线待插拔更换而系统已不具备冗余功 能的情况下,如果此时又有一个功率模块发生故障或者负载出现过载情况,则系统自动转集中静态旁路运 行状态,并机逻辑控制命令会使所有功率模块输入输出主电路继电开关断开而由市电直接向负载供电;

    (4)在市电和 UPS 系统都正常情况下,如果负载发生过载或者短路,当负载超过系统额定输出容量, 而小于全部功率模块输出功率的总和时,系统可继续正常运行,同时发出报警信号,说明此时系统已不再 具备冗余功能;如果负载过流量超过所有功率模块输出额定功率的总和,则并机逻辑命令会使所有功率模 块输入输出主电路继电开关断开并自动转系统静态旁路,由市电直接应付过流的负载;

    (5)市电故障:在检测到市电故障的情况下,整流器能够自动的将直流母线与交流输入相隔离,同 时,电池组进入放电状态,由逆变器保证负载的连续运行;一旦市电恢复, UPS 能够在不需要人为干预 的情况下,自动恢复到正常运行模式;

    (6)手动维修旁路,完整的 UPS 应包含一个手动维修旁路开关,以便在整个系统故障或者需要进 行紧急维修时,将系统转维修旁路。

    3、N+1 模块化 UPS 与单机 UPS N+1 系统的相同与不同之处

    把冗余容错和模块化快速插拔修复技术同时应用到一台UPS中,这就是"模块化UPS"。模块化UPS实 质上是集成的N+1冗余并机系统与模块化体系结构的融合,如图5所示。

    N+1 模块化 UPS

    N+1 模块化 UPS 与单机 UPS N+1 系统的相同与不同之处主要表现在以下几个方面:

    (1)两者都是 N+1 冗余并机系统,具有完全相同的运行模式;

    (2)同样是 n+1 冗余系统,而模块化 UPS 却是把整个系统集成起来。集成的内容包括:输入配电、 输出配电、维护旁路、集中静态旁路、集成的并机背板、集成的系统管理等。

    与单机组成的 n+1 冗余系统相比,集成的优势表现在以下几点:
    系统高度集成,省去了现场安装、连线、调试等工作,可缩短现场调试时间,并保证系统调试质 量,减少认为错误,提高系统可靠性;
    设备制造和供应渠道的统一化:无需再单独购置和安装输入输出配电、静态旁路和维修旁路等设 备、缩短建设周期、缩短故障修复时间(发生故障后不再有设备供应上的推诿问题); ?
    设备及各环节的匹配(相当于定制):包括设备容量的匹配、设备输入输出阻抗的匹配、设备及 各环节的连接的规范化,提高系统运行的可靠性;
    节省机房设备安装的物理空间;
    集中管理:提高管理维护水平、降低运营费用

    (3)模块化 UPS 可热插拔快速修复的优势 

    可快速修复的系统:对关键设备的故障修复时间是单机冗余系统的 1/8~1/10;
    提高安装、调试和维护的质量:减少人为错误、降低维护难度;
    提高部署速度:模块化无工具安装,可将系统安装时间缩短到单机冗余系统的 1/10~1/15
    提高系统扩展能力:可按需要扩展系统容量;
    避免过度规划:降低设备和备件成本,明显地提高设备工作效率;
    简化规划、设计、安装流程:降低非设备资本成本。

    4、模块化 UPS 的可靠性

    从图 4 可以看出,模块化 UPS 是一个具有多重冗余结构的可扩充的模块化系统,要确切的分析其可 靠性是一件很繁琐的事,况且还需要若干符合实际情况的设备和元件的权威性的可靠性数据。但是,我们 可以针对 UPS 设备中最薄弱的环节 AC/DC 和 DC/AC 变换,从方案配置的角度比较单台 UPS 1+1 冗余并 机和 n+1 模块化 UPS 在可靠性和可用性方面的差别,依此可看出模块化系统结构对系统可靠性和可用性 的影响。这样做是接近实际情况的,因为不管是单台 UPS1+1 冗余并机还是模块化 n+1UPS,其可靠性都 主要取决于最薄弱的环节 AC/DC 和 DC/AC 变换。

    1+1单机冗余并机系统在运行中只允许一台发生故障并可在不影响系统正常运行的情况下脱机修复, 两台同时故障时系统宕机。

    而模块化n+1UPS(n>1)虽然也是只允许一台功率模块发生故障并可在不影响系统正常运行的情况 下脱机修复,两台同时故障时系统宕机,但两台同时故障的情况却有多种组合。例如:

    n=2,两台同时故障的组合有 3 种:1/2、1/3、2/3; 

    n=3,两台同时故障的组合有 6 种:1/2、1/3、1/4、2/3、2/4、3/4; 

    n=4,两台同时故障的组合有 10 种:1/2、1/3、1/4、1/5、2/3……;

    (1)满负荷情况下可靠性的区别

    在系统满负荷情况下,1+1冗余并机和n+1模块化UPS都是只允许一台发生故障并可在不影响系统正 常运行的情况下脱机修复,两台同时故障时系统宕机。图5是1+1冗余并机和4+1模块化UPS的可靠性模型。

    模块化 UPS

    如果单机(模块)的可靠度为 R,1+1 冗余并机可靠度为 R1+1,4+1 模块化 UPS 可靠度为 R4+1,则:

    4+1 模块化 UPS

    在所有各台可靠性相同且等于0.99的情况下,则:

    可靠性

    (2)实际负荷小于满负荷情况下可靠性的区别

    在实际应用中,设计负载容量都小于UPS的额定输出容量,特别是在数据中心投入使用的初期,负载 的实际容量往往小于UPS的额定输出容量,此时UPS的冗余模块的数量会大于1,我们可把系统定义为模 块化n+m冗余并机系统。 ?

    n:单机(或模块)数,n 个模块(单机)额定容量之和等于 UPS 实际输出负载容量; ?

    m:实际冗余的单机(或模块)数。

    n+m系统在运行中,允许发生故障电源模块数m与系统实际输出负载量的大小有关,仍以4+1冗余系 统为例,当系统实际负载等于UPS系统设计最大负载量时,实际运行情况为4+1冗余系统,运行中允许一 台发生故障并可在不影响系统正常运行的情况下热插拔更换,任意两台同时故障时系统宕机。即:n=4, m=1,两台同时故障的组合有10种:

    n+m系统

    当系统实际负载等于设计最大负载量的75%时,则4+1冗余系统变成3+2冗余系统,系统中允许两台同 时发生故障并可在不影响系统正常运行的情况下热插拔更换,任意三台同时故障时系统才宕机。即:n=3, m=2, 三台同时故障的组合有10种:

    3+2冗余系统

    当系统实际负载等于设计最大负载量的50%时,4+1冗余系统变成2+3冗余系统,系统中允许3台同时发生故障并可在不影响系统正常运行的情况下热插拔更换,任意四台同时故障时系统才宕机。即:n=2, m=3,四台同时故障的组合有5种 :

    2+3冗余系统

    假定单机(或模块)的年可靠度R=0.99,可计算出1+1冗余并机与n+1模块冗余并机的区别,以及负 载量的影响,如表(1)所示,这里取n=4。

    表(1)1+1冗余并机和4+1模块化冗余并机的可靠性差别及与负载量的关系

    1+1冗余并机和4+1模块化冗余并机

    通过以上分析可得出下面的结论:

    ① 由单机1+1组成冗余系统,当单机可靠度为0.99时,并机系统可靠度可达到0.9999,此值与负载无关, 也就是说,不管系统实际负载量是多少,系统永远是1+1冗余,不允许两台同时故障,可靠度也就永远是 0.9999;

    ② 由模块(包括单机)组成的4+1冗余系统,当系统实际负载等于设计额定负载量时,如果模块(或单 机)可靠度为0.99,则系统可靠度为0.999,低于1+1冗余系统。但是当系统实际负载等于UPS系统设计最 大负载量的75%时,则4+1冗余系统变成3+2冗余系统,系统可靠度高达0.99999,当系统实际负载等于设 计最大负载量的50%时,4+1冗余系统变成2+3冗余系统,可靠度再次提高到0.99999995。

    5、模块化 UPS 的可用性

    计算可靠性时使用的数学模型和计算方法同样适用对可用性的分析和计算,但是计算可用性时我们用 可靠性的另一个参数-平均无故障时间 MTBF,同时还要用到可修复性参数-平均修复时间 MTTR。

    假定:单机 UPS 的 MTBF=10 万小时(这是目前产品的水平,相当于 11 年);
    单机 UPS 的 MTTR=8 小时(包括故障反应和故障修复时间)
    模块化 UPS 功率模块的 MTBF=10 万小时(同单机 UPS)
    模块化 UPS 功率模块的 MTTR=1 小时(在有备份的情况下由维护人员热插拔修复);

    则: UPS 单机的可用性 A=MTBF/(MTBF+MTTR)=0.9999

    UPS 单机

    对可用性的计算表示在表(2)中

    表(2)1+1 冗余并机和 4+1 模块化冗余并机的可用性差别及与负载量的关系

    1+1 冗余并机和 4+1 模块化冗余并机

    通过以上分析可得出下面的结论:模块化UPS的可用性比1+1单机冗余并机的可用性高,根本原因是 模块化UPS的模块故障后可由维护人员热插拔修复,使故障修复时间MTTR降到1个小时。再者,可用性也 随着负载量的减轻而提高,当系统实际负载等于设计额定负载量的75%时,可用性已经近似为1。

    以上分析得到的可靠性和可用性结果都是比较高的,如果把系统中的输入配电、输出配电、变压器、 UPS 的输入和输出接触器等环节都考虑在内,那么实际的可靠性和可用性数值都要小得多。

    六、结束语

    可修复和可快速修复功能是提高系统可用性的关键,模块化是可修复和可快速修复的根本条件,也是 提高适应性和降低总拥有成本的最有效的措施。"系统模块化设计"已经成为数据中心设计建造必须遵守的原则。"系统模块化设计"观念在行业中已上升到一个新的高度,成为了一种富有创造性并具突出战略意义 的设计哲学。

    "模块化UPS"是最高级别的模块化系统,其设计理念必然会引领着数据中心基础设施设计建造的发展方向。

    但是,使整个数据中心基础设施模块化要比一台UPS系统模块化困难得多,很多设备和环节虽然可模 块化-具有独立功能、可独立运行、可整体安装,但要插拔维护却很困难或者不可能,甚至在系统运行后再 拆卸、更换、移动也不是件容易的事, 这是当前数据中心基础设施普遍存在的问题。要解决这个问题, 不仅要使所有设备和环节在连接方式上具备可拆卸、更换、移动的条件,还要在物理条件上-空间、走道、 工具的可操作性等方面做精心的设计。




    atp溶液