http://www.2brightsparks.com/resources/articles/RAID-is-not-a-backup-solution.html
20GB左右的DB 由15K 146G 4顆RAID5 SAS 改為台灣A牌記憶體大廠的SATA 200G 2顆RAID1 SERVER SSD
讀取速度約快8倍至10倍,用了一個月後,將SSD硬碟送回原廠評估可用期限。
大概均有六年以上壽命。
另外的大型資料庫,我們要求了一個很高的IOPS,在以往沒有SSD情況下,
可能要數百顆RAID 1+0 SAS HDD才弄的出來,但是現在 40 顆SSD 就能達到了。
簡單講,像台鐵訂票或江惠演唱會這種會產生瞬間大量交易的系統。
以往可能要像一台麵包車一樣大的儲存設備才能達到,現在可能一櫃就解決了。
RAID是需要經常性的進行妥善的管理(備援,異地,測試,演練),沒有這些,
可能連換錯硬碟都可能毀掉一組系統。
曾經有個例子,某個RAID5的系統內,硬碟故障,工程師換了一顆以為是新的HDD進去。
結果那顆硬碟是別的機器的RAID1,在RAID CARD BIOS裡沒看清楚,就直接REBUILD進去了。
最後就是找DB BACKUP RESTORE了。
哪種RAID可信?手邊有超過1000台伺服器,有RAID1 RAID5 RAID1+0,
結論就是不管是什麼RAID,永遠都有可能在Rebuild的過程中給你再壞一顆。
所以備份一定要異機,甚至異地。但這個機率可能比人為對於RAID不瞭解,按錯的機率低。
新年快樂,各位辛苦的IT...
WingC. wrote:
大大,如果是raid...(恕刪)
taipeier wrote:
曾經有個例子,某個RAID5的系統內,硬碟故障,工程師換了一顆以為是新的HDD進去。
結果那顆硬碟是別的機器的RAID1,在RAID CARD BIOS裡沒看清楚,就直接REBUILD進去了。
最後就是找DB BACKUP RESTORE了。...(恕刪)
這個有點誇張,一般來說應該不會造成array crash才對。
taipeier wrote:
結論就是不管是什麼RAID,永遠都有可能在Rebuild的過程中給你再壞一顆。...(恕刪)
這個我有深刻體驗,某客戶的 RAID5 array (no spare disk)有顆硬碟亮燈,確認過其他硬碟及陣列狀態都是正常,拔出故障硬碟的瞬間,另一顆正常的硬碟亮燈.... 連 Rebuild 的機會都沒有就掛了。
========================================================
意外隨時會發生,一個好的 disaster recovery plan 才是王道
ddarfbapam wrote:
樓主好。寫得太多啦,...(恕刪)
近代的enterprise-based RAID都會提供一些預測機制...
例如在PD出現嚴重異常前的情況下..
利用HSP進行較智能的copyback..
這某種的EHSP可能會判定被移轉的HSP狀態是static..
當然這些做法還是不脫於利用SMART來操作..
在特定的時間會polling一次
不管哪個HSP被經過rebuild或著copyback過後, 都要將原來bad slot上的HDD進行更換然後反向操作copyback..
保持COD的一致性..
至於R5和R6, 在這1~2年的RoC產品規格都前幾年的暴力許多...
這差距已經是愈來愈小了...
內文搜尋

X