技術(shù)
導(dǎo)讀:對(duì)于大規(guī)?;臄?shù)據(jù)中心而言,宕機(jī)事故并不罕見。不過,對(duì)于數(shù)據(jù)中心而言,宕機(jī)仍是難以承受的事故。宕機(jī)會(huì)造成數(shù)據(jù)中心的業(yè)務(wù)中斷,云端服務(wù)終端,進(jìn)而導(dǎo)致用戶無法正常訪問應(yīng)用程序。在嚴(yán)重的情況下,會(huì)給企業(yè)造成巨大經(jīng)濟(jì)損失。
對(duì)于大規(guī)?;臄?shù)據(jù)中心而言,宕機(jī)事故并不罕見。不過,對(duì)于數(shù)據(jù)中心而言,宕機(jī)仍是難以承受的事故。宕機(jī)會(huì)造成數(shù)據(jù)中心的業(yè)務(wù)中斷,云端服務(wù)終端,進(jìn)而導(dǎo)致用戶無法正常訪問應(yīng)用程序。在嚴(yán)重的情況下,會(huì)給企業(yè)造成巨大經(jīng)濟(jì)損失。
3月3日凌晨,一則關(guān)于阿里云宕機(jī)的消息高居微博熱搜前列,眾多網(wǎng)友在微博上進(jìn)行互動(dòng)反饋,輿論瞬時(shí)炸開了鍋。原來,阿里云疑似出現(xiàn)大規(guī)模宕機(jī)事故,該事故造成眾多APP、網(wǎng)站一時(shí)陷入癱瘓狀態(tài)。
圖片來源:圖蟲創(chuàng)意
針對(duì)這一事件,阿里云在官方回應(yīng)中稱,華北2地域可用區(qū)C部分ECS服務(wù)器等實(shí)例出現(xiàn)IO HANG,經(jīng)緊急排查處理后逐步恢復(fù)。目前阿里方面已經(jīng)全面排查其他地域及可用區(qū),未發(fā)現(xiàn)此類情況。針對(duì)本次故障,阿里云將根據(jù)SLA協(xié)議,盡快處理賠償相關(guān)事宜。
宕機(jī)事故頻發(fā) 帶來嚴(yán)重危害
其實(shí),對(duì)于大規(guī)?;臄?shù)據(jù)中心而言,宕機(jī)事故并不罕見。不過,對(duì)于數(shù)據(jù)中心而言,宕機(jī)仍是難以承受的事故。宕機(jī)會(huì)造成數(shù)據(jù)中心的業(yè)務(wù)中斷,云端服務(wù)終端,進(jìn)而導(dǎo)致用戶無法正常訪問應(yīng)用程序。在嚴(yán)重的情況下,會(huì)給企業(yè)造成巨大經(jīng)濟(jì)損失。據(jù)相關(guān)行業(yè)專家表示,數(shù)據(jù)中心停機(jī)在美國每分鐘造成的平均損失約為8000美元。
隨著互聯(lián)網(wǎng)行業(yè)的快速崛起,在數(shù)據(jù)存儲(chǔ)和處理上都有了更高的要求。巨頭們紛紛搭建數(shù)據(jù)中心以支撐日常業(yè)務(wù)的開展,并以此搶占更大的市場份額。無論宕機(jī)原因如何,最終的影響范圍有多大,一旦出現(xiàn)宕機(jī),企業(yè)對(duì)公有云的信心都會(huì)發(fā)生動(dòng)搖。
回顧整個(gè)2018年,國內(nèi)外云服務(wù)提供商宕機(jī)事故不在少數(shù)。導(dǎo)致的原因也各不相同,不過均造成了嚴(yán)重后果。OFweek光通訊網(wǎng)摘選了幾個(gè)2018年中發(fā)生的代表性宕機(jī)事件,看一看它們有哪些特點(diǎn)。
Youtube宕機(jī)-2018年10月16日
2018年10月16日晚上,美國、南美和歐洲許多網(wǎng)友像往常一樣打開YouTube,本想著像往常一樣刷上幾個(gè)視頻,可在輸入了賬號(hào)和密碼后,發(fā)現(xiàn)怎么也登陸不上去,仔細(xì)核對(duì)賬號(hào)密碼后,依然登陸不上。
事后才發(fā)現(xiàn),原來YouTube在當(dāng)時(shí)發(fā)生了宕機(jī)事故。事故當(dāng)天,許多用戶出現(xiàn)網(wǎng)頁無法打開、用戶無法登陸、視頻播放中斷的情況。網(wǎng)頁端和移動(dòng)端均出現(xiàn)類似情況,整個(gè)中斷時(shí)間超過2個(gè)小時(shí)。
騰訊云宕機(jī)-7月24日
2018年7月24日上午,騰訊云因廣州運(yùn)營商光纜物理中斷宕機(jī)。據(jù)微博用戶@盧松松爆料,騰訊云此次宕機(jī)影響較大,導(dǎo)致騰訊云廣州區(qū)域全面斷網(wǎng),包括騰訊云主頁、控制臺(tái)、DNSPod等。
谷歌云-2月15日/7月17日
2018年2月15日,谷歌應(yīng)用開發(fā)平臺(tái)的出現(xiàn)了數(shù)據(jù)庫故障引發(fā)了不少該平臺(tái)客戶的煩惱。該問題于接近于中午12點(diǎn)時(shí)發(fā)生在Google Cloud Datastore上,這是為規(guī)模型用戶設(shè)計(jì)的一款非關(guān)系型數(shù)據(jù)庫。
在事故中,谷歌PaaS服務(wù)Google App Engine的用戶經(jīng)歷了長達(dá)一小時(shí)的錯(cuò)誤與延遲情況。游戲玩家在這次事件中受波及最為嚴(yán)重,因?yàn)椴簧俚臒衢T在線游戲使用了谷歌服務(wù)。而像Pokemon Go和Snapchat也備受沖擊。