• 2

Synology+那斯狼+RAID1 找不到故障硬碟!?

我剛買3個月的synology 218+, RAID1, 那斯狼8TB*2, 用起來一切順暢,
但從前幾天開始,忽然不正常,一直不定時的出現打鐵聲跟電鑽聲,吵得我睡不著覺.....同時硬碟燈號會恆亮卡住10秒左右,依以往經驗判斷這應該是有壞軌了。
於是我使用DSM自帶的測試工具, 分別對兩顆硬碟做測試 :
SMART 快速檢測 ---過關
SMART 完整檢測 ---過關 (這檢測花了12小時才完成)
IRONWOLF健康---過關

雖然兩顆硬碟連完整測試都過關了,系統顯示良好一直說服我不要想太多安心地繼續使用......但我還是不放心這個電鑽聲音。於是隔天打去詢問技術客服。
Syn客服回復: 請紀錄卡住的時間,在讓工程師檢查log看看當時是否有程式忙碌造成...或者拆下一顆硬碟分別測試開機,再交叉放置插槽,以判斷是插槽故障還是硬碟故障。
(OS:我也沒在下載東西,只存放照片檔案,以及使用notestation, 平常都是IDLE狀態阿...)

然後問Sea客服回復: 如果檢測都沒問題那就沒問題,有時候聲音大一些也還是可以正常使用很久的....或者接電腦用SEATOOLS檢查一下個別硬碟。
(OS:但這聲音就是壞軌聲阿.....)

雖然目前系統還是顯示RAID1配置良好,但這樣繼續使用我不放心.......也吵得無法睡覺...
於是回家後我先把磁碟1拆下來,單獨用磁碟2開機.......
BINGO!! 一開機就開了快10分鐘,一直出現電鑽的聲音,好不容易進了DSM,系統顯示配置已毀損
Synology+那斯狼+RAID1 找不到故障硬碟!?
Synology+那斯狼+RAID1 找不到故障硬碟!?
Synology+那斯狼+RAID1 找不到故障硬碟!?

此時20:46開完機, 於20:49我再去做SMART以及IRONWOLF健康測試,結果還是顯示正常。
這裡可以發現有狀況的這幾天9/22~9/23之間檢測也都是正常的。
Synology+那斯狼+RAID1 找不到故障硬碟!?

這是甚麼狀況!! 所有的工具都檢測不出來單一硬碟問題!?
接著我關機, 拔下磁碟2, 將磁碟1放進去並開機。磁碟1的狀況就完全正常,顯示配置降級。
Synology+那斯狼+RAID1 找不到故障硬碟!?

此時可以確定磁碟2是有問題的,今天我將磁碟2放到PC上用SEATOOLS做以下檢測:
SMART -- 通過
硬碟自我短檢測 -- 通過
一般長檢測 -- 失敗
一般短檢測 -- 失敗
Synology+那斯狼+RAID1 找不到故障硬碟!?

我再請教SEA工程師,他是說SMART與IHM都只能做預估,當硬碟故障參數的count還沒到時,不會判定異常...所以檢測不出來是正常的,用SEATOOLS的長檢測可以做物理檢測,就能發現問題。

朋友說我是碰到硬碟機王才會這樣......
想請教各位先進
1.有人碰過這樣的狀況嗎? 在RAID1中,明明硬碟2就是故障的卡卡的讀寫不順,系統卻顯示正常..

2.正常在RAID1配置下,任一磁碟的I/O故障,不是應該會被抓出來踢掉嗎?
(是代表磁碟2的狀況在許可的範圍內?! 或是SMART及IHM都沒報錯的關係!?)
(如果磁碟2開機後硬碟狀況會直接被判定配置毀損,那RAID1配置在跑的時候卻抓不到磁碟2的問題? )
我以前使用WinStorageServer2003的軟RAID1,其中一顆壞軌就整個系統不給開機了....
也碰過IBM SCSI,3顆跑硬RAID5,其中2顆默默壞軌了都沒被下線,最後資料庫讀不出來....raid rebuild失敗

其實硬碟故障了就出保固這無所謂,但是.....
若是放在機房等聽不到硬碟異音的地方,磁碟2有這種狀況存在, 剛好磁碟1也出包,那系統就要準備救援了吧...有多顆硬碟就更緊張了......
2019-09-24 17:37 發佈
aaron1977 wrote:
我剛買3個月的synology...(恕刪)


這比較有可能是因為 raid1, 在 synology nas 下讀取時, 它可能只從 disk#1 讀取, 所以 disk#2 雖有問題, 但本身硬碟檢測不出, 它可能也沒有全壞.

如果此時你較少寫入 NAS 的情況, 可能 disk#2 的問題就較不容易發現, 這也反應出當你只用 disk#2 開機時, 明顯異常就反應出來.

應該是運氣太好才會遇到這種事.
FB: Pctine
>>也碰過IBM SCSI,3顆跑硬RAID5,其中2顆默默壞軌了都沒被下線

陣列卡 碰到硬碟壞軌,首先 並不會因 壞軌 而下線,因為壞軌也能正常使用,
除非判定SMART錯誤 才會直接下線。
1. 有安置熱備援硬碟,陣列卡會 自動替換
2. 抽取盒閃紅燈,等待替換

另一個問題,陣列卡可設定一定時間內做 驗證、檢測 動作,絕大部分使用者都沒把這
玩兒開啟,開了會降性能,不開 哪天跑重建 一次玩完。

作業系統有沒有安裝陣列卡管理程式也是很重要,陣列卡 碰到任何異狀都能
經由管理程式 通知使用者 ( E-Mail ) 更別談細部設定。
從來沒有相信過套裝NAS這東西 保存數據翻車這麼多了 還是有人要上車我就搞不懂了
台式機耗電了一點 跑NAS也沒這麼容易翻車 重點套裝NAS 一斷電問題都來 莫名提報錯誤
大多不是硬碟背黑鍋 通常都是套裝NAS韌體寫得不好 當然這攸關CP值問題 數據穩比任何CP值都還重要

WD紅盤壽命就是兩萬四千小時 中間故障率還是很高 只是容許套裝NAS誤判的時候 不會突然停止
正常硬碟 電源穩定 散熱OK 基本都能保存數據 讀寫 三萬小時 四萬小時不出問題 至於套裝NAS就不好說了
pctine wrote:
應該是運氣太好才會遇到這種事.(恕刪)

我是3C產品的照妖鏡.......
aaron1977 worte:
我剛買3個月的synology...(恕刪)


DISK2
SMART 快速檢測 ---過關
SMART 完整檢測 ---過關 (這檢測花了12小時才完成)
IRONWOLF健康---過關

NAS上面檢測不出來 拆下來到桌機就可以檢測出

Synology 應該要提供可以可靠偵測硬碟問題的方法才對 不然浪費時間又白測試
weikichen wrote:
NAS上面檢測不出來 拆下來到桌機就可以檢測出...(恕刪)


感謝分享, 可否分享在桌機上所用的檢測軟體? 謝謝.
FB: Pctine
難道說現在的作業系統都只依賴SMART判定硬碟故障?
除了SMART以外,linux系統的NAS沒有其他自帶的工具可以檢測硬碟故障了嗎?
連window都有chkdsk阿....
weikichen wrote:
DISK2SMART...(恕刪)

剛剛發現,原來QNAP有壞軌掃描耶......感覺好專業...
https://www.qnap.com/zh-tw/enterprise_apply_v2/con_show.php?op=showone&cid=7


話說,為什麼有做SMART了還要做壞軌掃描功能呢?
還有其他NAS廠也有做壞軌掃描功能的嗎?

真是...真的自己遇到了才知道這個壞軌掃描的重要性...
aaron1977 wrote:
剛剛發現,原來QNAP...(恕刪)

基本上s.m.a.r.t 跟壞軌掃描都不太準
只是壞軌掃描準確度高不少
很多都是進行壞軌掃描抓到壞軌後smart才跳錯誤

硬碟這種東西最可怕的故障是s.m.a.r.t 跟完整掃描都完全抓不出來
我就有遇過一顆WD紅標案例
完全掃不到錯誤 但是只要寫入就會失敗
這時候NAS檔案一上傳就會卡住當掉 但是有些小檔案還會可以傳
後來一顆一顆替換修復
才找到出問題的那一顆 獨立的一顆在windows寫入會I/O Error
在多bay NAS這種故障威脅非常高
因為根本不知道哪一顆出了問題
  • 2
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?