汇总:云计算技术服务器宕机恶性事件警告录

2021-03-21 10:51


汇总:云计算技术服务器宕机恶性事件警告录


谈到,客户和厂商在选用新的基本构架时,都仍在探寻1种未知行业。常见故障难题和预料以外的服务器宕机都会不能防止地产生。就算是最大且最好是的云厂商,在其服务有时候的 停转 时,以前万全的方案也是徒劳无功。

那末,在云服务器宕机产生时,究竟甚么地区错误了?IT主管和客户能够从每次的恶性事件初中到甚么?以便协助读者更好的运行自身的服务,这里依据服务器宕机安全事故的比较严重水平对1些服务器宕机恶性事件开展了排列。

微软

就算是在检测阶段,都会遭受出现意外服务器宕机。微软在2009年3月就产生了这样的事儿,Azure服务器宕机22小时。试用期中仅有实验的运用程序流程遭受危害,因而沒有甚么大的损害。

在云计算技术的发展趋势历程中,Azure服务器宕机非常早了,可是IT主管早已了解在云端灾备和常见故障時间方案是明智的第1步。但是,Azure处在原始环节,没人了解它会对云计算技术造成是多少危害,或说它会怎样危害服务器宕机针对人们针对云计算技术的自信心。

比较严重水平:低

安宁洋時间,中午5:45,全世界许多Azure客户亲身经历了Azure服务管理方法作用电力工程终断。针对大多数数客户,电力工程终断沒有危害她们的服务交货,并且她们可以对其开展管理方法。微软申明大多数数顾客在闰年2012年的服务器宕机中,在102小时以内开展了管理方法作用修补,虽然针对许多客户来讲,在电力工程终断刚开始以后并没产生甚么,安稳渡过24小时。

比较严重水平:低

Rackspace

2009年6月,主机代管变化成云厂商的RACKSPACE亲身经历了1次比较严重服务器宕机,那时候开关电源跳闸,1系列的发电动机备份数据不成功,大部分服务器机架清静了,这可并不是耸人听闻!

以便该企业的信誉度,RACKSPACE在官方blog上报导了全部恶性事件,而且在新浪微博(推特)上就全部亲身经历帮教谈话,可是评价家還是# rackspacefail #的标识满天飞。

比较严重水平: 高

可是在2009年11月份Rackspace又产生了1次比较严重服务器宕机,不尽人意的回应就沒有满天飞了。具体上, Rackspace的顾客还有机会当众地重伤厂商的服务器宕机时,她们却将其叙述为 没甚么大不上的。 这就代表着Rackspace遇难呈祥,再次出示了适合的升級和迅速修补。

顾客表明,在其业务流程离线15⑵0分钟后,Rackspace十分全透明且迅速地解决了这个难题。这次恶性事件,为该企业带来了确保,还处理了其公关危机。如果沒有关键的数据信息遗失,服务也能迅速还原,顾客该令人满意還是令人满意的。实际上那些满口 100%一切正常运作時间 的厂商,大多数数顾客好像還是不容易由于1次不经意的安全事故而舍弃。

比较严重水平: 低

Salesforce

2010年1月,Salesforce的68,000名顾客遭受了最少1个小时的服务器宕机時间。

该企业在这其中汇报 系统软件不成功 ,全部的1切,包含备份数据在这1阶段都歇菜了。这样招致了1些负面关心,Salesforce的锁住对策Force变成众矢之的,这是1种服务平台即服务(PaaS)商品,在Salesforce以外就不可以应用了。因而当Salesforce有难题了,Force也就挂了。

虽然此次服务器宕机并沒有对该企业导致多大损害,其同VMware 的VMforce协作在童年春季引得热议竞相,马克贝尼奥夫在服务器宕机后不到1个月的時间,还夸一夸奇谈Salesforce 是最大的公司云计算技术企业。 她们仿佛对这个不太在乎。

比较严重水平:中

HEROKU

Heroku是1家为Ruby程序编写語言服务的PaaS公司,预估有大概44,000个运用安裝在上面,2010年1月,使用价值两万美元的高容量亚马逊EC2案例在这上面挂了。

亚马逊在1小时以内让这些案例由 复生 ,但还Heroku商品开发设计者還是遭受了严厉打击。Heroku在1个单1的能用性局域运行其全部的案例,这就致使她们关键的详细服务终断,缺乏云计算技术最好实践活动,代表着这样的服务器宕机会阻拦其再次发展趋势。

Heroku以这类方法喝了1壶,她们觉得解决云服务时,这次恶性事件便是 最高命令 。

比较严重水平: 高

TERREMARK

回望3月份,VMware协作小伙伴Terremark在7小时的服务器宕机后,把vCloud Express的将来至于风险的地方,这次恶性事件致使了联接性没了。这次服务器宕机据汇报仅有2%的顾客遭受危害,可是那些收到危害的人就厂商怎样解决这件事上,表述了极其明显的不满。

Terremark讲话人在顾客怒吼时称该企业是个 老妈子 代管企业。最强大的是他竟然把Terremark的回应和亚马逊作比照,这真是便是告知顾客,在挣扎这选谁的情况下,把情况汇报和服务预警都算进去吧

自然,vCloud Director不断了1段時间,VMworld 2010上这类激动劲也就退去了,Terremark服务器宕机好像没留下是多少话柄。

比较严重水平: 中

亚马逊

好像全部的别的云计算技术服务器宕机和亚马逊的Web服务服务器宕机相比全是小孩科。因此云服务厂商的开山鼻祖,亚马逊在以往数年中遭受的服务终断和具体的灾祸匀称遍布。

2009年6月,1次少见的安全事故让1些顾客丧失亚马逊EC2服务5小时,可是大多数数顾客都将其看作是发展之痛。这类有点怪异的答复方法部沒有不断,在1次遍布式阻断式服务进攻和悠长的电子器件电子邮件管制以后,亚马逊的灾祸回应融洽和顾客关联刚开始缺少。

比较严重水平: 高

此外1起恶性事件涉及到了亚马逊弗吉尼亚的数据信息管理中心,遭受了雷雨,致使系统软件服务器宕机6小时,可是也从1个侧边显示信息了该企业的发展趋势;亚马逊的回应時间值得毫无疑问。

比较严重水平: 中

伴随着云计算技术不断发展趋势和拓展,难题也相继而来。5月份,1些目录面上看起来不有关的安全事故在亚马逊弗吉尼亚数据信息管理中心再度上演,在1周的跨度内致使了3次不一样的服务器宕机。第1次是不中断开关电源(UPS)变换到备份数据开关电源时不成功,1机架的服务器挂了;第2次产生在4天下后,1个开关电源分派箱短路故障,致使服务终断8小时。最终两天后,1辆轿车撞击了电线杆子,断开了数据信息管理中心的开关电源,致使半小时服务器宕机。无论相关系没事儿,是否大恶性事件,这么短的時间产生这3次服务器宕机针对任何厂商来讲都不能能是个琐事。

比较严重水平: 高

成心思的是,大多数数顾客好像针对亚马逊Web服务都持有1种对外开放的心态。她们接纳了亚马逊技术性的繁杂性,和将会致使的出现意外难题,最关键的是她们认同亚马逊云自然环境的有效价钱,出示了她们要想的工作中使用价值。

亚马逊也没错过顾客的 期待 ,再次服务器宕机;自然也展现了期完善价钱下的完善度,在2010年4月份的服务器宕机中迅速做出相应。1篇较长blog公布,AWS的情况网页页面也按时升级,1则则简讯汇报了服务器宕机身后的缘故和怎样处理的。

比较严重水平: 中

2011年4月,因为亚马逊在北弗吉尼亚州的云计算技术管理中心(这是块福地啊~)服务器宕机,包含回应服务Quora、新闻服务Reddit、Hootsuite和部位追踪服务FourSquare在内的1些网站遭受了危害。

让人惊讶的是,亚马逊云服务终断将近4天却沒有违背亚马逊EC2服务的服务级别协议书(简称SLA)。亚马逊FAQ问与答解释说, 它保证在365天的服务期 内1个地区有着99.95%的服务运用率。 而这1次,几位遭受危害的客户埋怨,在服务终断期内,亚马逊并沒有立即发布全新的信息内容。衰退了难道说?

比较严重水平:高

总结

伴随着大多数数云计算技术客户留意到上述的这些恶性事件,这样的服务器宕机在公司数据信息管理中心中经常产生。大家所列举的其实不彻底,别的的內容可自主参照别的报导。云计算技术其实不完善,更多的服务器宕机恶性事件1直会产生下去。全部的顶级厂商能做的便是学习培训哪些地区错误了,并调整这些难题,以防1些黑马公司根据更好的跟踪纪录,夺取了其云厂商的领头羊影响力。



扫描二维码分享到微信

在线咨询
联系电话

020-66889888