軟體定義儲存 VMware VSAN 高可用性 SDS 儲存 備援 災備

VMware VSAN延伸叢集 實作跨站點同步HA複寫

2016-01-18
本文將介紹最新的VSAN 6.1版本新增了哪些特色功能,並提出VSAN 6.1新式延伸叢集架構的最佳實務建議,讓管理人員規劃出來的VSAN延伸叢集架構具備最佳的運作彈性。
見證主機(Witness Host)

試想,在VSAN延伸叢集運作架構中,當其中一個站台發生重大故障損壞事件導致該站台停止服務的時候,系統是如何判斷的?若只是兩個站台之間發生網路中斷,但是兩個站台並沒有停止服務,此時會不會造成誤判產生「裂腦(Split-Brain)」的情況呢?

在VSAN 6.1的延伸叢集運作架構中,必須在第三站台建立「見證主機(Witness Host)」,這台見證主機便是擔任兩個站台之間仲裁(Quorum)的角色,它可以是實體主機或VM虛擬主機,並且根據不同的運作架構規模大小,有不同的硬體需求建議:

小型規模(1 VMs?10 VMs)
·2 vCPU、8GB vRAM
·Boot Disk:8GB、SSD Disk:10GB(1顆)、HDD Disk:15GB(1顆)
·支援最多750個見證元件

中型規模(10 VMs?500 VMs)
·2 vCPU、16GB vRAM
·Boot Disk:8GB、SSD Disk:10GB(1顆)、HDD Disk:350GB(1顆)
·支援最多21,000個見證元件

大型規模(500 VMs以上)
·2 vCPU、32GB vRAM
·Boot Disk:8GB、SSD Disk:10GB(1顆)、HDD Disk:350GB(3顆)
·支援最多45,000個見證元件

網路環境需求

在VSAN延伸叢集運作架構中,VSAN Cluster和VSAN Node所處位置稱之為「資料站台(Data Sites)」,而見證主機所處位置則稱為「見證站台(Witness Site)」。

在資料站台當中,VSAN Cluster的VSAN Node彼此之間,採用「多點傳播(Multicast)」來傳輸中繼資料及運作狀態,以及採用「單點傳播(Unicast)」來傳輸資料I/O的部分。此外,資料站台與見證站台之間,則是透過「單點傳播」來互相進行溝通及存活偵測作業,如圖14所示。


▲ 圖14 VMware VSAN延伸叢集資料站台及見證站台的網路架構示意圖。(圖片來源:VMware白皮書 – VSAN 6.1 Stretched Cluster Guide)

因此,在資料站台之間可以規劃採用「Layer 2或Layer 3」的網路環境彼此連接,並且網路延遲時間必須在「5 ms RTT(Round Trip Time)」以下才行,也就是說單向的網路延遲時間必須小於2.5毫秒(ms)才行,並且網路頻寬建議至少採用「10Gbps」。

在資料站台與見證站台之間僅建議採用「Layer 3」網路環境,並且網路延遲時間不可以大於「200 ms RRT」,也就是單向網路延遲時間必須小於100毫秒才行,並且網路頻寬建議至少採用「50?100Mbps」。

ESXi Host與VM虛擬主機

值得注意的是,在VSAN延伸叢集運作架構中,因為必須考量到其中一座資料站台完全下線的情況,因此VMware建議每座資料站台應僅運作VM虛擬主機總數的50%即可。

例如,若規劃的VM虛擬主機總數為500台的話,那麼每座資料站台應僅運作250台VM虛擬主機,以便發生災難事件時,另一座資料站台可以完成承載所有的VM虛擬主機工作負載。

在VSAN延伸叢集中ESXi Host的數量,最少數量的情況下為「3台(1 + 1 + 1)」ESXi Host,也就是資料站台A運作1台ESXi Host,資料站台B運作1台ESXi Host,見證站台也運作1台ESXi Host,如圖15所示。


▲圖15 VMware VSAN 3+3+1延伸叢集運作架構示意圖。(圖片來源:VMware白皮書 – VSAN Stretched Cluster Performance and Best Practices)

目前,在VSAN 6.1中,最大的運作規模則建議為「31台(15 + 15 + 1)」ESXi Host,也就是資料站台A運作15台ESXi Host,資料站台B運作15台ESXi Host,見證站台也運作1台ESXi Host。

傳統叢集 vs 延伸叢集

管理人員應該會很想知道,在採用VMware傳統叢集來運作VSAN運作架構,以及新式的VSAN延伸叢集架構時,在IOPS儲存效能表現上,到底哪一種叢集比較出色。

從VMware官方的測試結果可以得知,在採用VMware傳統叢集來運作VSAN運作架構時,由於是VSAN Node彼此在近端,因此IOPS表現較好。

當採用VSAN延伸叢集架構時,若資料站台之間的網路延遲時間為1毫秒時,則IOPS相較於傳統叢集來說大約降低20%,若資料站台之間的網路延遲時間為5毫秒時,則IOPS相較於傳統叢集來說大約降低35%,如圖16所示。


▲圖說。圖16 VMware VSAN傳統叢集與延伸叢集IOPS效能比較統計表。(圖片來源:VMware白皮書 – VSAN Stretched Cluster Performance and Best Practices)

在資料「寫入延遲(Write Latency)」方面,同樣的傳統叢集因為主機之間彼此在近端,因此為2.9毫秒,而採用新式的VSAN延伸叢集架構的時候,則分別是4.9毫秒與7.7毫秒,至於資料「讀取延遲(Read Latency)」方面,兩種叢集架構的表現則差不多。

結語

透過本文的說明,相信大家已經了解到最新的VSAN 6.1版本多了哪些特色功能,能夠幫助企業或組織提供更佳的高可用性機制。

此外,在本文的後半部也給予了VSAN 6.1新式延伸叢集架構的最佳實務建議,讓管理人員在前置作業流程時能夠注意相關細節,以便規劃出來的VSAN延伸叢集架構能夠為企業或組織提供最佳的運作彈性。

<本文作者:任職於QCT雲達科技,網路暱稱Weithenn。為Microsoft MVP及VMware vExpert。早期主要研究Linux / FreeBSD各項整合應用,目前則專注於Microsoft及VMware虛擬化技術及混合雲運作架構,個人網站 http://weithenn.org。>


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!