• 14

如何一次管理存取約40顆硬碟 更新到第九頁

wenwenwen wrote:
感謝 JQJQ 大的...(恕刪)


客氣了

這功能打開後,性能會低一點,對了 24小時開機的電腦這功能很好用,
如果是每天要用才開機,最好別用這一個功能,因為不曉得得跑到哪時候
才跑得完,直接手動一致性/驗證會比較快一點。

在國外看到 SAS 15k rpm 硬碟600G x3 RAID5 跑重建,
超快... 記得好像1個多小時,還是2個多小時忘了。

硬碟在陣列群上會不會掉線,可以測試,用 硬碟重組 就可以知道了
,用系統內建或者 O&O Defrag 去跑,不穩的跑沒幾個小時就掉線,
這部分還可以測試,線材連接及訊號有沒有問題。( 資料最好有一半以上)
重組我得花上 24小時才跑得完 硬碟慢也有關係。

Maxtor 300G RAID5 不能跑,跑重組一定會掉線,雖然使用上沒問題,
過些時候替換成 2TB。( 等有錢時... )
我把 ASM (Adaptec Storage Manager) 更新到最新版了,從原有的 18530 -> 18570
真的多了 S.M.A.R.T 的資訊,可惜沒有 User Friendly,要自己查代碼表。

我有覺得我的 RAID 系統不太穩定,也就是 JQJQ 大說的會掉線,大約一個月會發生一次,就 Event Log 說有Bad Block,這個訊息在3-5天收到個幾次之後,有一天就會聽到警示音,然後 Spare Disk 就跳上去接手了。

訊息就像下列這樣...
Bad Block discovered: controller 1 (74038800).
Bad Block discovered: controller 1 (741c8a00).

但奇怪的是,被說壞掉的那顆,我都沒去動它,過個幾天,它又會自己 Copy Back 回那一顆。

所以我的 RAID 系統看來還有要改進的地方。

不想唸物理了...
Bad Block discovered: controller 1 (74038800).
Bad Block discovered: controller 1 (741c8a00).
通常會出現這個,基本上是硬碟有問題或訊號有問題(通常可以靠SMART得知,有時候不可以),
單純的離線不會出現這個問題,單純的離線訊息如:
Logical device is degraded: controller 1, logical device 2 ("Backup").
通知非備援等級,降等了

倘若非硬碟出狀況
1. 抽取盒的問題 (可試著換槽安插硬碟,如果依舊都是同一槽,那可以確定抽取盒的問題)
2. 抽取盒非纜線連接,可試著將連接線換插座安插 (排除排線問題)
3. 將 Sata 3.0 降為 Sata 1.5 ( 可在開機時 Ctrl+A 進入陣列卡控制選項中來調整,預設值:Auto )
或者硬碟上可用跳線變更。
4. 抽取盒採用纜線銜接,換槽插情況依舊是同一槽,保固內將抽取和送修。

上述方法試試看 ^_^ (記得先備份)

Adaptec
http://www.adaptec.com/en-US/_common/compatibility?refURL=compatibility
有硬碟的相容資訊

當碰到缺少一顆、掉線,此時去交換插槽或者排線,那就真的可屁了
當初剛買陣列卡,有徹底的玩過。跑重建時並不會。 *凡事都有意外的時候,預先備份總沒錯*

ASM 有更新,Adaptec 韌體及驅動程式, 通常也會跟著更新。

陣列環境掉線問題得 100% 解決,否則倒楣跑重建時另一顆掉線,那就甚麼都沒有了
我去查了硬碟相容列表了,我目前用的硬碟居然沒有在上面。
裏面沒有 WD 綠標 1.5TB 15EARS,但是有 1TB, 及 2TB 的 WD 綠標 10EARS 及 20EARS。
但是硬碟的版本 1TB,1.5TB,2TB 都是相同的 80.00A80。

靭體也有更新呢。我目前的卡是 5.2-0(17544),Adaptec 網站上的是 5.2-0(17899)。

待 Verify & Fix 完,就來更新 BIOS。
從 7/26 下午 4 點開始,狀況變得不太正常...出現一堆訊息

Logical device is degraded: controller 1, logical device 1 ("Data 1").
Rebuilding: controller 1, logical device 1 ("Data 1").
Logical device failed: controller 1, logical device 1 ("Data 1").
Logical device failed: controller 1, logical device 1 ("Data 1").

結果發現 Data1 不見了,依手冊的建議做 Rescan 沒效... 只好下 Force Online

Started the bus rescan: controller 1.
Bus rescan complete: controller 1.
Forced the logical device online: controller 1, logical device 1 ("Data 1").
Logical device is degraded: controller 1, logical device 1 ("Data 1").
Rebuilding: controller 1, logical device 1 ("Data 1").
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c85).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c7d).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c35).
Bad Block discovered: controller 1 (74032c55).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c7d).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c60).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c75).
Bad Block discovered: controller 1 (741c8a00).
Bad Block discovered: controller 1 (741c8b06).
Periodic scan found one or more degraded logical devices: controller 1. Repair as soon as possible to avoid data loss.
Bad Block discovered: controller 1 (74032c2d).
Bad Block discovered: controller 1 (74032ca0).
Bad Block discovered: controller 1 (74032c85).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c8d).
Bad Block discovered: controller 1 (74032c6d).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c65).
Bad Block discovered: controller 1 (741c8a94).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (741c8ae0).
Bad Block discovered: controller 1 (74032c9d).
Bad Block discovered: controller 1 (74032c2d).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (74032ca0).
Bad Block discovered: controller 1 (74032ca5).
Bad Block discovered: controller 1 (74032c75).
Periodic scan found one or more degraded logical devices: controller 1. Repair as soon as possible to avoid data loss.
Bad Block discovered: controller 1 (74032c00).
Bad Block discovered: controller 1 (741c8a00).
Bad Block discovered: controller 1 (741c8ad8).
One or more logical devices contain a bad stripe: controller 1.
Logical device is normal: controller 1, logical device 1 ("Data 1").
Rebuild complete: controller 1, logical device 1 ("Data 1").
Building/Verifying: controller 1, logical device 1 ("Data 1").

在 Building/Verifying 時電腦變好慢,於是修改 Task 優先權,不過沒什麼用。

Changed task priority to Medium: controller 1, logical device 1 ("Data 1").
Changed task priority to Low: controller 1, logical device 1 ("Data 1").
One or more logical devices contain a bad stripe: controller 1.

然後移除舊版的 ASM,移除完居然沒問我就重開機... 之前的 Building/Verifying 就被中止了。
裝上新版的 ASM 發現之前的 Log 沒有不見


One or more logical devices contain a bad stripe: controller 1.
One or more logical devices contain a bad stripe: controller 1.
Copy back in progress: controller 1, logical device 1 ("Data 1").

依 JQJQ 大的建議,做 background consistency check 的設定

Changed background consistency check mode to Enabled: controller 1.
One or more logical devices contain a bad stripe: controller 1.
Copy back in progress: controller 1, logical device 1 ("Data 1").
Changed the background consistency check period to 30 days: controller 1.
One or more logical devices contain a bad stripe: controller 1.
Copy back in progress: controller 1, logical device 1 ("Data 1").
One or more logical devices contain a bad stripe: controller 1.
Copy back complete: controller 1, logical device 1 ("Data 1").

剛才重新下 Building/Verifying 的動作,希望處理完不要再出現驚嘆號。

Building/Verifying: controller 1, logical device 1 ("Data 1").
不想唸物理了...
anchun wrote:
聯力 EX-50 5...或許可以考慮這個(恕刪)


S牌的應該比較好
聯力那個,樓主沒POST backplane的相片
小弟相信,用料也是普普
那種沒幾個零件的backplane
要我直接熱插拔,我還真沒那個膽

等主機板送修回來,換機殼時,我再來拍張CSE-M35TQ的相片供有興趣的人參考看看

CSE-M35TQ支援SGPIO、I2C





補幾張Adaptec 5805+HITACHI 2TB*8跑RAID6裝在某張爛MB上測出來的圖












同時從兩台Qnap TS-509 PRO(兩台都是1TB*5,跑RAID5)拉檔案進來的速度
1Gb的頻寬不夠用了


在同一組RAID上做讀/寫的速度
還不賴



網芳
路很長,夢卻難圓 如果可以... 我想縮短天空和大地的距離,夢想和現實的差距...
如果都是同一顆硬碟,我認為是硬碟掛了,如果是不同顆硬碟輪著出狀況就挺麻煩的,
一般版本的綠能省電板不太經得起操,似乎沒幾下就葛屁。

不見得沒有在硬碟相容表上就不能使用,畢竟相容表經常在更新。
我的主硬碟也不再相容表上頭,希捷 SAS NS.2 600G

>>Verify & Fix
手動 ? 如果是 background consistency check 這功能是 30天內循環(預設值30天可調整)
介面卡上的陣列群組,看是幾個邏輯磁區,就依序30天內跑完 Verify & Fix,
手動 Verify & Fix 會快很多,但所跑的邏輯磁區性能會大減。
上述功能並不影響韌體更新,畢竟 ASM 韌體更新很好用,連硬碟韌體更新都可以跑,
只不過硬碟韌體得另外跟廠商要才行。

Building/Verifying 、 Verify & Fix 重新開機後會繼續執行,並不會因此中斷,
通常是進入作業系統後就開始跑,當長時間在介面卡 BIOS 上調整時,也會開始跑。

ASM 上頭調整時,幾秒內調整太快會反應不過來,所以會發現怎麼調了沒有用,尤其是執行
重建、建立新邏輯磁區、砍掉邏輯性磁區....等,能立即反應只有在介面卡上的BIOS。

>>在 Building/Verifying 時電腦變好慢
怪怪的,我的不會,除非是系統碟,做 Building/Verifying 頂多讀寫會略慢,但不會慢到多慢,
超大檔案複製才會有感覺。

>>剛才重新下 Building/Verifying 的動作,希望處理完不要再出現驚嘆號
連 Verifying 都過不了,以後讀寫大檔案時很不穩定。有些硬碟得設低
Array Stripe Size ,不要使用 128 / 256 .... 這種較大Size ,可設定
32 / 64 可增加穩定性。



ZGMF-X10A.Freedom wrote:
S牌的應該比較好聯力...(恕刪)

EX-50 5-BAY <> CSE-M35TQ
兩者不同,前者外接硬碟櫃(RAID)採用 E-Sata ,後者是內置抽取盒
CSE-M35TQ 不錯,當初有詢問,大概我被當成笨蛋
不太願意說明,後來改買 XC-34D1-SA1C-0-R ,做外銷的產品,
台灣反而比較少看到。
測試圖好像被掐住了脖子,能理解您說的板子

1G 頻寬不夠,可以合併頻寬,找台支援的交換器就可以了,電腦裝上2埠網卡,
我挺想買一台交換器支援合併頻寬來跑跑

理由如下:
wenwenwen wrote:
我把 ASM (Ad...(恕刪)


JQJQ wrote:
Bad Block ...(恕刪)



半夜看完這串文章,我開始擔心到時候開始做磁碟陣列會不會出甚麼問題!

畢竟這些東西我都還沒碰過,就只是憑著網路上前輩所提供的資料,

跟自己本身一點的基本常識而已,兩Bay 64T感覺起來很沉重!

到時候就要借重兩位的經驗了!

jimepily wrote:
跟自己本身一點的基本常識而已,兩Bay 64T感覺起來很沉重!
...(恕刪)


搞RAID5/6除了是為了加速、減少HDD損失的空間外
"附帶"讓你HDD掛掉1/2顆時資料不會就此蒸發
可不是讓你不備份咧
路很長,夢卻難圓 如果可以... 我想縮短天空和大地的距離,夢想和現實的差距...
ZGMF-X10A.Freedom wrote:
搞RAID5/6除了...(恕刪)


HI,備份是一定要做的,不好意思我沒說明完整,

所以另外一份是不做RAID的,

會用HBA卡一樣連結32顆2T硬碟,

以單一硬碟的方式來做各自的備份,

至於資料的分類倒是不用擔心,

因為原本的資料就有分門別類作管哩,

像是動作片01 02、劇情片01 02,

01就是第一份,02就是第二份,

用這種最單純,最手動的方式來做備份,

所以每次要找資料就要到防潮箱的一百多顆硬碟翻,

實在是沒甚麼效率,所以才會下訂決心做磁碟陣列。
ZGMF-X10A.Freedom wrote:
搞RAID5/6除了...(恕刪)


認同
除非是雙備份,雙備份跑陣列比較快

jimepily wrote:
半夜看完這串文章,我...(恕刪)

>>跟自己本身一點的基本常識而已,兩Bay 64T感覺起來很沉重!
常識是自己問出來、玩出來的,沒有人會去教你,玩出來得靠手上有硬體可玩,
要問出結果手上也得有硬體,否則不懂別人在說甚麼。

陣列掛一顆很容易,掛兩顆... 我只能說平時沒在維護,硬體買來不是擺著就會安全無虞。
( 排除硬碟瘟疫 )

跑陣列,我建議使用企業版硬碟,安靜省電推薦使用 WD RE4-GP ,效能型 WD RE4,
一般版本便宜又大碗可買日立 2TB (五碟挺熱的)。WD 硬碟最好挑捷元代理,售後服務比較好。
至於 WD 綠碟省電板 不推薦,是沒錯很便宜,但耐用度值得考慮。

會害怕陣列是一件好事,是因為不了解才害怕還是因為知道了陣列並不是絕對的安全,不管
是哪一項,已經有進一步的了解,當使用後會安心許多,不就是這樣子也沒甚麼大不了,
陣列比單顆安全多了,如要備份就買台藍光燒錄機來備份,尤其是那種資料不再變更的來備份。

>>半夜看完這串文章,我開始擔心到時候開始做磁碟陣列會不會出甚麼問題!
應該說,慶幸組陣列,如果是單顆硬碟資料早掛了,哪還有時間談,資料沒了傷心都來不及。

32顆單獨硬碟跑備份(不組陣列) ,心裡想著,光備份就得花上好幾天,光看就累人且也不安全。
有錢的可以搞 陣列RAID6 雙備份,速度快多了,甚至資料還可以同步,更別說...
同時平行負載。
  • 14
內文搜尋
X
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 14)
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?