Google Drive 日期:2013年3月18-19日,时间:约17小时;在3月18日星期一,很多用户在试图访问其Drive文档和文件时,出现加载缓慢或者超时的情况,这大约持续了约三小时。一天后,第二次Google Drive中断让一些用户在约两小时内无法访问该服务。这两天后,Drive再次停机12小时,这真的让用户非常恼火。 Google Drive事故影响 可以想象,论坛和社交网站又是各种抱怨。谷歌称最初的问题与该公司的网络控制软件中的故障有关。该系统显然没有负载均衡,导致该公司的服务器出现不必要的延迟。而这反过来又导致Drive的连接管理系统出现问题。谷歌承诺将修复这个漏洞,调整其负载均衡设置,确保其网络服务之间“更大的隔离度”。该公司还调整了其Drive软件来让该服务在面对延迟和恢复时“更具弹性”。 CloudFare网站崩溃 日期:2013年3月3日;持续时间:大约一个小时;CloudFare的业务主要围绕帮助客户保护和加速网站,但在3月3日早上,该公司自己的网站以及所有的服务都出现故障,导致785000个其他网站崩溃,包括Wikileaks、4chan以及一些政府网站。 CloudFare事故影响 在大约一小时内,当你试图访问任何CloudFare连接的网站时,你都会得到一个“无法路由到主机”的错误信息。CloudFare公司声称边缘路由器(连接CloudFare的系统到互联网)的系统故障是这次事故的主要原因。虽然几台路由器的崩溃通常会导致流量转移,但在这种情况下,一个漏洞能让每台路由器脱机。工程师发现了有问题的代码,清除掉了代码,然后需要等待14个不同国家的23个数据中心重新启动所有路由器。 |