jimepily wrote:如果經費允許的話我也...(恕刪) >>兩組RAID6、熱備援、沒必要做到如此地步,又不是 OLTP平時多注意以及維護系統Maxtor 6B300S0 x3 RAID5昨天晚上 手不乖 ,明知道會掉線的硬碟,同時負數以上軟體讀寫,再加上同時解壓縮以及影像寫入(9分滿的硬碟還這樣玩,真是手賤),結果....讀寫速度變成一半覺得有異狀,看了主機其某顆硬碟抽取架亮紅燈了,哇! 是壞掉還是掉線 ? 開了Outlook 收信看看,結果是掉線,還被踢出物理性磁區,這次還真徹底,看來真的得去買新硬碟。將資料備份下來後原顆硬碟重建! 不,那得跑上兩天,砍掉重練不用半天就能將資料回復,結果還是繼續用... 好想買新硬碟,雖然喊了好久 以前不會這樣,應該是無法重組又經常砍砍殺殺再填補新資料,導致資料太過零散凌亂,就變成這個樣子。
還好 7/28 時的 Rebuild 完成了,昨天晚上又『掉線』一顆。現在在由 Hot Spare 重建中。(應該是掉線吧? 因為 SMART 資訊是正常的,而且進 Storage Manager 看,那顆現在標示為 Ready)每次壞的硬碟都不一樣,第五顆發生了 4 次,第四顆發生一次,昨晚壞的是第一顆。第五顆已拿去送修了。之前發生 Logical device is degraded: controller 1, logical device 1 ("Data 1") 時,被排除的硬碟都還是標示為 Ready,而且當 Hot-Spare Rebuild 完後,過幾天它又自己 Copy Back 回去原來的硬碟。這段時間電腦是一直開著,沒有重開機過。幾次之後就沒太在意它了,結果才會發生 7/26 在 Rebuild 時又壞一顆,讓 Logical device failed。本來想用 JQJQ 大所告知的無痛升級 由 RAID 5-> RAID 6。結果我先試著開一個 100G 的 Raid5 來線上轉換為 RAID 6。結果花了差不多 15 小時。所以決定把那 DATA1 裏所有資料複製出來,重新建立一個新的 RAID6,再移回去。目前那 logical device 1 ("Data 1") 上面的驚嘆號都一直存在,可能是我之前 Force Online 的緣故吧。而且 Events 中一直會出現 One or more logical devices contain a bad stripe: controller 1. 的訊息。待我這個週末來重建一個新的 RAID 6 logical device 1 ("Data 1")
wenwenwen wrote:還好 7/28 時的...(恕刪) 輪著出現這個問題,建議您 Sata 3.0 設定為 Sata 1.5 ,使用硬碟朓腺或者陣列卡上的BIOS調整也好,記得要去設定,估計是這個原因導致。不會影響性能,除非單顆硬碟讀寫超過150MB/sec>>目前那 logical device 1 ("Data 1") 上面的驚嘆號都一直存在應該有被降等或者某顆硬碟異常(有些陣列資料異常也會發生),可以用 ASM 查驗硬碟資訊。>>One or more logical devices contain a bad stripe: controllerBST 有問題 ? 大概遺失一部分資料將該邏輯磁區上的資料備份下來,砍掉分割表 > 砍掉該RAID5邏輯磁區 >原本陣列 5 群下的各顆硬碟初始化(這個步驟可省略,但做是比較好) > 建立 RAID 5,最後將資料備份回去。ASM 裡的 Status 資訊也挺重要的,可以辨識哪個地方出狀況,是訊號中斷還是指令中斷或者式硬碟的問題。 ( 物理磁區 > 屬性 對話框 )記得查看陣列卡的溫度,溫度別超過 90度,超過會有警報聲。剛裝陣列卡有試著讓蜂鳴器叫叫看,嫌吵乾脆關了。介面卡溫度 冬天 63度 夏天最高約73度,機殼有側板風扇向內吹,如果直接將風扇吹向陣列卡,溫度還能更低。
感謝 JQJQ 大,待 Rebuild 完就來把 SATA 由 3.0 改為 1.5,看會不會比較穩定。我磁碟陣列卡的温度是 73 度,4月時剛建起來時是 69 度。我有裝一顆風扇來吹卡,不吹的話會超過 90 度。目前已經有在備份檔案。要來重建一個 RAID6。不過我 ASM 的畫面怪怪的,Connector 1 的 Device 0 明明就是 Data 1 所用到的磁碟機。但是它的圖示(屬性中的State)卻顯示它是 Hot Spare Disk。
>>它的圖示(屬性中的State)卻顯示它是 Hot Spare Disk。有看到 + 號,移除掉就好了。ASM 右上部分就有一個 - 號,或者點選該物理磁區,滑鼠右邊鍵移除Hot Spare Disk也可以。我有碰過這個問題,當初沒移除好才會造成跑驗證或者重建,出現驚嘆號是正常的 (原有格式修復環境下,新建立不會有)---ASM 有時候得登出再登入(可關閉再開啟),資料才會更新---以前閒著沒事,問 Adaptec 介面卡溫度85 -90 警訊, 90 以上危險程度,不能超過 100 ,超過會怎麼樣..我沒試過,國外有破百度其介面卡沒掛,不過經常這麼做,遲早有一天葛屁我若把機殼側板風扇給關閉,大概會88 度左右 >_< 夏天室溫 32 - 33 度對了>>One or more logical devices contain a bad stripe: controller重建陣列後如果還是會出現,只能說該陣列下的某顆硬碟掛了, 找出來送修( 排除線材及抽取盒問題 )
經過了約 46 小時的 Build/Verify,現在有了新建的 1.5T * 7 顆的 RAID 6 了。因為要讓電腦早點能上線,我沒有一顆顆重新 Initial Disk。只把原有的 Logic Device 刪除再重建。用 ASM 來刪除 Logic Device 時它還要求上面不得有分割表。可是我那有問題的 Logic Device 只要一進 Windows 的磁碟管理就會當掉,所以最後直接進 BIOS 去刪,在 BIOS 中操作就不會要求磁碟裏不可以有分割表了。BIOS 我也更新到最新版了。下載的更新檔說無法在 x64 模式下執行。所以用USB 做成 DOS 開機碟,再執行 AFU 的程式來更新 BIOS。另外再請教 JQJQ 大,設定磁碟為 SATA 1.5G 的傳輸速度選項在那裏呢,我在 BIOS 中找不到。不知是否我買的這 51645 卡不支援這個設定。如果要用硬碟的 Jumper 來設定,我現在手頭上只找到 2 個 Jumper,不夠用。
哎喲,我還真的是捨近求遠。還做什麼 USB 開機碟來更新 RAID 卡的 BIOS。原來在 ASM (Adaptec Sotrage Manager) 的畫面裏面就有更新 RAID 卡 BIOS 及所附掛磁碟機 Firmware 的功能了。