您現(xiàn)在的位置:首頁 >關(guān)于我們 >行業(yè)新聞 >專家支招:八個步驟讓你全自動搞定存儲故障?

專家支招:八個步驟讓你全自動搞定存儲故障?

時間:2010年12月9日

  增加預(yù)算并購買一套軟件和一系列服務(wù)來提供這方面的功能,或者利用工具中的方法來提供能夠在問題變成麻煩之前自動地處理這些問題的服務(wù)。這里有八個步驟,希望能夠讓你按圖索驥,找到解決問題的方法,摒棄那種花錢費力還不一定能解決問題的做法。  (服務(wù)器托管)

全自動搞定存儲故障:

第一步:識別問題所在——如果有問題的話。

  你可以選擇對你的數(shù)據(jù)中心進行一次全面的評估,或者你可以從有數(shù)據(jù)庫的地方開始評估,或者從中間的其它地方開始。一旦你決定了檢查的范圍,你就可以開始了。你需要知道哪個硬件(包括通過SAN連接的硬件和直接連接的硬件)出故障了。你可能會既高興又驚詫地發(fā)現(xiàn)你居然有如此多的存儲設(shè)備。

第二步:研究故障。

  當交換機報告一個利用高端口的故障時,一個幫助臺標簽會被創(chuàng)建?上,這通常在凌晨兩點,并且數(shù)據(jù)中心里沒有人來幫助你診斷這個故障。因此,你必須跳上車趕過去,或是撥到你的虛擬專用網(wǎng)(VPN),并研究這個故障。然后你發(fā)現(xiàn)這個故障的時間似乎很熟悉。似乎備份工作在每晚的這個時候開始。但你查看備份報告工具時,磁帶正在工作而且所有事情看起來都很好。

  如果備份報告工具在這時顯示了備份工作失敗的信息,你也許從這個故障中找到癥狀表現(xiàn),從而引起警惕并采取措施以期能在未來解決這個問題。

第三步:制定糾正故障的措施。

  第二天上午,在睡了幾小時并喝了一杯咖啡后,你回到辦公室給你們組的人解釋當時的情形。如果這是一個確實的警告,那么這個組要共同決定一個糾正的措施。這可以采取以下形式:為交換機增加更多的吞吐容量,中斷備份工作,改變時間表,或者僅僅提高交換機端口的吞吐極限。時間和故障都應(yīng)是對問題的自動回應(yīng)的一部分。

第四步:將解決辦法和故障表現(xiàn)記錄到知識庫。

  定義一個存儲管理政策的最好方法就是考慮在日常存儲環(huán)境(包括磁盤、磁帶、交換機、主機和應(yīng)用程序)的操作中發(fā)生的故障。然后你可以考慮這些故障和警告是怎樣發(fā)生的以及工作組是怎樣處理每個故障的(從確定故障到解決問題)。我把這些故障和警告看作是故障表現(xiàn),把解決問題的措施看作是初期的存儲管理政策。我必須說這種方法對我非常有用:“從實踐成為措施。從措施成為政策。”

第五步:這個故障重復(fù)出現(xiàn),F(xiàn)在怎么辦?

  從知識庫中查看你記錄的第一次發(fā)生時的解決辦法,并按照記錄的步驟解決這個故障。如果故障的表現(xiàn)是不同的,那么研究這個故障并提供一個解決辦法。

第六步:回到故障解決模式。

  第二天,你應(yīng)該檢查故障表現(xiàn)來確認那是否是相同的情況。這可能是一個重現(xiàn)的故障,這要求通過過濾技術(shù)來將這個假故障從警告系統(tǒng)中移除,或者改變產(chǎn)生故障的基礎(chǔ)設(shè)備或交換機的極限。

第七步:如果故障反復(fù)發(fā)生,用一種簡單的腳本來自動回應(yīng)。

  現(xiàn)在你是這種故障的熟練工,你可以寫出回應(yīng)內(nèi)容的腳本或篩選出針對這種類型的故障所使用的解決辦法。

第八步:繼續(xù)監(jiān)控和訓練。

  用這種方法培訓你的全體員工,包括新員工。

  最后,如果這樣可以使你多睡幾小時并使你能將寶貴的時間集中于那些真正重要的事情上的話,那么你正在做正確的事,而且能夠繼續(xù)做更大的事。   (服務(wù)器托管)

  目的:阻止你的工作組總是解決那些并不是真正問題的問題,這樣他們才能集中精力于手邊的真正的大問題。

Copyright© 2004-2020 河南海騰電子技術(shù)有限公司 版權(quán)所有   經(jīng)營性ICP/ISP證 備案號:B1-20180452   豫公網(wǎng)安備 41019702002018號    電子營業(yè)執(zhí)照