資料中心 TCO 硬碟機

正確選用硬碟機 提升資料中心可靠度

2013-11-29
資料中心的TCO (總擁有成本)通常包括資料中心建造與運作的所有成本,例如資金和運作費用、硬體與軟體成本,以及資料中心的管理、維護和修理。因此,硬碟機及其他硬體的穩定性,將大幅影響資料中心維護的相關運作費用。
儘管近年固態硬碟機(SSD)日漸普及,但大部份的數位資料仍是儲存在磁性記錄媒體,亦即硬碟機(HDD)中,這也幾乎是每個資料中心的運作基礎。而在各產業中,無論是醫療業、零售業和製造業,皆可見大型資料中心蹤跡,這類資料中心可支援線上搜尋、購物、社群網路以及其他由IT產業所提供的解決方案。

不論資料中心是否建置在一組包含硬體RAID(Redundant Array of Independent Disks)資料備援的高階儲存系統之上,或是使用較低階的硬體和由通用的分散式檔案系統所提供的軟體資料備援,硬碟機的故障和汰換成本都非常昂貴,且會明顯增加資料中心的總擁有成本(Total Cost of Ownership,TCO)。根據產業分析表示,每個意外事件所導致的硬體故障、維護、修理、汰換等,將會耗去100美元到300美元的成本。

目前的環境對運算效能和儲存容量的需求與日俱增,因此TCO儼然成為資料中心業者的主要評量標準。TCO通常包括資料中心建構與運作的所有成本,例如資金和運作費用、硬體與軟體成本,以及資料中心的管理、維護和修理。因此,硬碟機與資料中心其他硬體的穩定性,將大幅影響資料中心維護的相關運作費用。

硬碟沒那麼不可靠

即便有些不同意見,但硬碟機確實算是資料中心內最穩定的硬體元件之一;反而是具備許多其他元件的儲存和運算伺服器,會限制硬碟機應有的發揮空間。

一般來說,散熱風扇的平均無故障時間(Mean Time Between Failures,MTBF)至少為10萬小時;伺服器電源供應器的MTBF則為40萬小時;一般近線硬碟機則有100萬小時以上的MTBF,比上述元件穩定得多。

當然,資料中心內,或在一般伺服器中的硬碟機可能比風扇或電源供應器來得多,大量的硬碟機自然會提高特定時間裡的故障發生可能性,導致更換需求。

幸運的是,仍有許多方法可讓資料中心業者扭轉乾坤。 首先,硬碟機的可靠性大多取決於運作條件,而這是資料中心業者可以控制的。即使兩部一模一樣的硬碟機,若其中一部是在惡劣的環境中運作使用,其可靠性可能會降低五倍。因此,資料中心業者可透過運作環境的調整,來確保更高的穩定性及最低的總體運作成本。再者,希捷科技為適應不同運作條件製造各種類型的硬碟機,適用於桌上型電腦、近線以及關鍵任務環境。

實際資料中心內的硬碟機,其使用以及承受壓力方式也有許多差異。硬碟機受到的關鍵壓力參數主要是使用時間、運作溫度和使用者工作負載。而這些參數通常和資料中心的架構,包括拓撲、伺服器設計、整體資料中心儲存容量、使用率、虛擬化、工作量平衡等,以及使用者的應用程式,包括雙向資料傳輸量、資料傳輸率等息息相關。接下來,我們將個別分析使用時間、運作溫度和使用者工作量對穩定性的影響。

依工作時間選擇等級

我們不難以理解使用時間對硬碟機穩定性的影響。以數學方式來看,下列簡單的方程式即可表示使用時間和產品穩定性的關係,而這也代表整體元件MTBF的累積故障機率。當使用時間增加、累積故障機率也會增加。


也就是說,數字小於1的話,意謂著故障機率愈低,裝置可持續開機、運作及使用。

實際來說,在理想的桌上型電腦環境中,硬碟機的平均使用時間為每年2,400小時開機時數、約為每天6.5小時;而針對近線和關鍵任務環境中,硬碟機的預期使用時間為100%,一天24小時,這等於一年8,760小時的開機時數。

很明顯地,近線和關鍵任務硬碟機預期得在更嚴苛的使用時間壓力下運作。因此,在開發與測試硬碟機時,我們會針對硬碟機未來預期的運作條件,包括時間、溫度和工作量,來選擇設計與測試流程。

高溫幾乎會對所有電子和電子機械產品的穩定性帶來負面影響,包括硬碟機也不例外。根據阿列紐斯(Arrhenius)定律,溫度愈高、故障率也會快速增加。

相對來說,溫度對穩定性和MTBF的影響較廣為人知,且在硬碟機的設計和測試程序中也會考慮到這個環節。經驗法則是確保硬碟機的溫度愈低愈好、同時還必須維持在產品的指定溫度範圍內。

一般而言,不論硬碟機的類型為何,其運作溫度範圍介於5℃到60℃之間,若想要提升資料中心硬碟機的穩定性,就必須在有效散熱這方面下功夫。

工作負載攸關穩定度

工作負載對穩定性的影響就比較難以清楚界定。依據定義,硬碟機的主要功能是儲存和擷取資料,並可在每平方英吋的儲存面積上存放數百GB的資料。硬碟機可在持續資料傳輸率200MB/秒以上的基準下,記錄和擷取資料。

為了達到如此高的記錄密度和資料傳輸速度,磁性讀寫元件與快速轉動的媒體之間就必須保持若干奈米(1nm = 0.001μm)的實體間隔。這是一項非常複雜的技術設計工作,且關鍵要素在於硬碟機必須針對特定的工作環境,依據使用時間和客戶工作負載範圍等其他因素所界定,精心設計、測試與分類。

工作負載是用來定義在正常運作之下,硬碟機所承受的工作壓力量。例如,硬碟機A可能每天都要讀取和寫入幾GB的資料;而另一款相同設計的硬碟機B可能每天要讀取和寫入好幾百GB的資料。在這種情況下,我們會說硬碟機B運作時的工作負載更大。


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!