• 7

[轉貼] 警告!不要再用Raid 5了!

來源文章引用 批踢踢實業坊 › 看板 Storage_Zone

我覺得作者寫的不錯,因為網路上太多RAID 5 資料全毀的案例。

一、前言

我不是什麼危言聳聽,也不是什麼RAID排斥,也不是我爆了RAID5的悲憤警世文 完完全全只是數學問題。 有心有空看數學流程的,請繼續看下去。沒空的也請相信我。 不管你用的是主機板的RAID、還是用NAS的、抑或是高階陣列卡, 是Software-based RAID、Hardware-based RAID、抑或是Driver-based, 只要你用的是消費級的硬碟,且容量上TB等級, 不要再用RAID 5了 不要再用RAID 5了 不要再用RAID 5了 現在還再用RAID5的請趕快升級成RAID6。 就算你有10顆Hot Spare也一樣。 因為 當你遇到問題時 你完全成功重建的機率 比你想像中的 低 接下來開始解釋為什麼,會有硬碟規格和數學, 有心有空看數學流程的,請繼續看下去。沒空或看到數學就頭痛的, 也請聽進我一席話。

二、URE 硬碟有個參數,叫 uncorrectable read error, 更詳細一點的說叫 Non-recoverable read errors per bits read 簡稱ure,其中文為每位元讀取發生無法復原的讀取錯誤 一般消費級硬碟(包括消費級NAS碟),這個參數官方通常是給 1/10E14 (讀做10分之1的14次方,或10的負14次方,或零點零零零零零零零零零零零零零一) 是個看起來很小的值。 什麼意思呢? 平均每讀取100,000,000,000,000位元,就會讀到1位元壞掉、且無法修復的資料。 或是 平均每讀取12.5TB,就會讀到1位元壞掉、且無法修復的資料。 挖靠!這樣看起來更小了。 這個數值大家就先記在心裡。 企業級的硬碟,ure通常是1/10E15甚至1/10E16。

三、RAID 5 再來提提RAID 5。 RAID 5是啥,我就不細說了,不知道的你也不應該組RAID 5... RAID 5成員其中之一離線後,狀態會變為降級(degraded), 此時,若有備援、或是手動換一顆加入,則會進入重建狀態(rebuild), 重建時,會讀取所有資料,算出離線成員的資料,並寫入備援碟。 所有資料 = RAID 5可用容量,若你拿2TBx3組,就是4TB。 重建是否成功、能否保全資料,就看能否正確的讀取所有資料了。 PS. 一般RAID與檔案系統無關,控制器不會知道你的硬碟哪裡有、放了多少資料。 所以,重建時是對整組RAID、所有磁區去做。 例外是一些軟體層的RAID,本身即是檔案系統、或位於檔案系統之下, 在檔案系統的層級加入RAID概念,是可能只針對有資料的部分做重建的。 如ZFS、ReFS。

四、完美重建成功機率 接下來,就是高中數學了, 我們有 單次事件發生機率 ure 事件次數 = 可用容量 那,我們就能算多次事件下,發生(或不發生)的機率了: 完全不發生ure(不出錯)的機率(完全成功重建) = (1 - 單次機率) ^ (次數) = (1 - ure) ^ (容量) 帶入 ure = 1/10E14 可用容量 = 4TB(32x10E12位元) 完全不發生ure的重建機率 = (1-1/10E14)^(32x10E12) 喔數字都好大,怎麼算? 你可以用高級計算機、Excel或是取Log搭配一般計算機。 反正我直接告訴你答案: 使用消費級硬碟組成4TB可用容量的RAID 5,一個位元都不壞的成功重建機率 = 72.6% 順便再多給幾個資料點 4TB = 72.6% 6TB = 61.9% 8TB = 52.8% 我不知道你對這個機率是否滿意。 我個人是很不滿意啦。 若考慮容錯的真義,4TB的狀況對我來說尚可接受。 但在現在單顆4TB性價比如此高,誰會組個4TB的RAID5阿! 當然你可以用企業級、URE較低的硬碟,那是可以把機率提升到90%以上。 但也沒十分高,下面會附上表格。

五、發生read error時 重要:read error和上述的URE不盡相同,但這邊提一下讓大家參考 發生Read error時,根據硬碟與陣列控制卡的行為與設定,會有幾種狀況, 實際的情況比較複雜,我簡單列幾個出來:

1. 硬碟根本沒發現read error!但是讀出來的資料是錯的。 結果:你的資料壞了1bit(通常不止),而且不會主動發現! 嚴重性:看你的資料價值。

2. 硬碟發現Read error,可能是Checksum failed,並開始硬碟內的ERC。
2.a. 修復成功,嚴格說來這樣就不算URE。
2.b. 花過多時間修復,被RAID踢掉。 結果:這顆就離線了,如果你正在重建,恭喜你!RAID Failed! 如果你的RAID無法手動調整RAID組態...那狀況是有點嚴重。 2.c. 因TLER設定而及時放棄修復: 結果:RAID控制器收到錯誤訊息並記錄; 如果有容錯,則會嘗試用其他顆硬碟資料,重建這個位元。 如果容錯失效(如RAID5重建中),則會通常控制器跳過這個位元。


[轉貼] 警告!不要再用Raid 5了!

16TB,等於4TB 硬碟 5顆 組 RAID 5.
2015-02-22 14:10 發佈
文章關鍵字 警告 RAID 5
所以為何我選擇Raid 6 + 2 hot spare


還有一個最重要的原因就是通常建置時候所有的硬碟都是同時期購買甚至是同批

壽命大概就是那樣子...

所以當你一顆掛掉時候 ..其他顆的風險也是如此...

我總覺得作者似乎沒接觸過那些enterpise-based RAID所提供的一些額外features...
可能甚至沒好好使用過...

RAID提供怎樣的規格, 老實講...
那都是基本條件, 基本到不能再基本......
災害/預測救援的重要性在於這些製造RAID Stack(H/W and S/W)的廠商所提供的IP..
能提供那些在關鍵情況下即時的大幅降低資料的危機性...

不過這些IP相關的資訊取得並不是很透明..
而且大多使用者都不會想去看...
否則就是直接問廠商(A或L牌的tech support, 只要問對問題, 它們都算是很大方的)...
無論他怎麼寫,或是寫得多好,都不能看完後就直接相信,
看來這個作者對於儲存裝置的驗證,應該是完全的不懂.
因為只要簡單的驗證方式,就可以推翻他的說法了.

想要以數學計算去推翻RAID5作法,這也太好笑了吧.
陣列的意義在於恢復,不是在於到底壞了多少,況且用SSD的壞的更多,
另外...硬碟不知道有壞也很正常,因為判斷本來就不是硬碟本身.
RAID的說法也有許多是錯誤的,不知道放哪些資料????
明明機制裡面就能夠回推,怎麼會不知道呢?


RAID5環境下做寫入各項不同數值,
更換其一SSD後恢復資料,進行檔案比對作業卻依然正確.

SSD已經是將他所說的風險提高了,儘管如此依然沒問題,就知道實屬無稽之談了
.......

該擔心的應該是,主機上的隨機記憶體用的不是 ECC ,
非ECC使用就不擔心了還擔心天文數字的 RAID5,更別提
還有校驗機制。


文章雖轉貼但也代表樓主的意思,看完後 喔....

陣列處理器也是有讀寫 N 次後出現錯誤 (內建的比較慘)
單顆硬碟 讀寫 N 次也會出現不可修復的錯誤,RAID0 更別提了,
反正跟 2顆以上的 JBOD 一樣(完全沒有校驗機制)。


這種文章可參考不可全信之,硬體是一分錢一分貨。


寫的人沒玩過陣列卡,至少沒透徹,單憑數據說話
(不覺得寫的人有用過陣列卡,只看文件而已)

文章扯到 TLER ERC ,到底寫的人知不知道這是指些甚麼,
不過還少寫了 CCTL

( 我就不要寫得太難聽 )

總之.... 看完可忘,甚至就別看省的浪費時間
以後這篇文會跟嗶聲診斷文一樣被無知網友狂轉貼,然後變成聖經般的存在。
只要寫一大堆術語來呼攏大眾
這篇文就會被拱為聖經了
一般人為了從保護資料、成本、容量來算都會選擇RAID5來做備份
這篇文把RAID5寫得好像100%會重建失敗一樣叫大家趕快換RAID6
以現在最多人買的2T.3T來做RAID6的話能用的空間就變少了

這篇文章只要被瘋狂轉貼
我想這篇文大概會為硬碟商賺進大把銀子吧
畢竟要用RAID6又要有大空間的話
就必須購入單顆5T.6T空間來建置才行

做RAID5如果重置失敗
我想這篇文章的作者可能就會說:早就叫你用RAID6了吧~

那如果RAID6也重置失敗的話
我想這篇文章的作者可能就會說:這是你的命~

changpizz wrote:
無論他怎麼寫,或是寫得多好,都不能看完後就直接相信,
看來這個作者對於儲存裝置的驗證,應該是完全的不懂.
因為只要簡單的驗證方式,就可以推翻他的說法了


+1
downtodo wrote:
來源文章引用 批踢踢...(恕刪)
的確啦
是有聽聞重建時
毀掉機率不小

雖然有人認為危言聳聽
不過應該沒人想遇到重建
我在外國網站所得的資訊是普通消費級硬碟的URE rate說的是每12.25TB就會出現一次錯誤
而因為raid5,6重建時需要整個array都讀一遍,所以如果raid5總容量>12.25TB,rebuild的時候掃描到12.25TB時其中一隻hdd因達到URE rate而報錯,系統就會認為該硬碟已壞而把它踢出raid陣列
因為raid5只容許同時壞一顆hdd,所以當系統再踢一隻hdd出raid時整組raid5就會損毀
因應硬碟容量愈做愈大,但URE rate卻保持在12.25TB(PS:企業級和nas專用碟的URE rate會高一點,印象中是14TB左右),所以raid5在09年的時候已在外國開始叫停,亦同時預告raid6在幾年後開始不再可靠,普遍是呼籲轉用raid10
但實際上目前還是有不少公司在用大量的raid5陣列,但大多數有經驗的管理人員都會限定每組raid5的硬碟數目和容量上限,所以實際問題不大
最後重申,raid不等於backup,勤備份才是最重要的
另外,如果用raid5和raid6的朋友亦應定期檢查每組raid陣列的資料一致性,及早發現問題換上新的硬碟
以上資訊為以前組server考慮如何配置自己的raid陣列時爬文所得,如有錯誤還請指正
downtodo wrote:
來源文章引用 批踢踢...(恕刪)
  • 7
內文搜尋
X
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 7)
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?