Syonlogy 升級 DSM6.0.1 7393痛苦的歷程

公司當初是使用兩台Synology 713+做high-availability 叢集
礙於經費問題,想說既然有high-availability 叢集,應該就不用做Raid這樣也有比較多儲存空間可用

一直到上上週更新完DSM 6.0.1 7393後,high-availability 叢集副伺服器就失去離線
不過還好重新開機後又正常

隨後又更新DSM 6.0.1 7393 update1,更新完後更慘,high-availability 叢集直接顯示沒有副伺服
器,再加上副伺服器還沒有完成Update1更新,DSM版本不同也無法重新架設,副伺服器也完全連不進去。

致電Synology客服
回復說按Reset鍵,看看能否進入副伺服器,如果還是不行重新安裝DSM
最後再將兩台NAS都更新至DSM最新版,在重新建立high-availability 叢集。
後來試真的不行只好重新安裝系統

剛好發佈DSM 6.0.1 7939 update2更新,就直接把副伺服器更新,問題又來了一更新完儲存空間1損毀..................
可是硬碟SMART測試正常啊,心想算了反正這是副伺服器,等等high-availability 叢集架好資料就會備份回來,
所以心一橫就直接重新建立儲存空間。

於是我也把主伺服器更新至DSM 6.0.1 7939 update2,重新開機後沒事,隔不到1分鐘準備要建立high-availability 叢集時,
突然間跳出儲存空間1損毀....................(OS 淦連主SERVER也給我掛點)

這時候電話鈴聲也響起大家都在抱怨連不上File server。
心想完了難道我的職業生涯就到此了嗎?公司幾乎有4/3的資料都在儲存空間1。

還好主伺服器重開後,一樣可以連只不過因為硬碟損毀,只能唯讀不能寫入,同事才稍微安份一點沒把我殺了
我又再度致電Synology客服
客服:你有SMART檢測嗎?我:有硬碟是好的
核對一下數據部分 客服:你硬碟有壞軌喔!我:有壞軌也不至於完全不能用,這樣也太扯了。
客服:你可以直接上我們網站看技術支援部分,有詳細解說相關處理方式
我:可是兩台NAS都是更新完update2才發生相同問題,而且我公司急用,資料很重要
客服:那你有做Raid嗎?
我:沒有
客服:那沒辦法了你只能重架儲存空間

.............................這時我又再度陷入黑暗
稍微思索一下,可能要先想辦法備份資料做RAID1會比較安全,但是又要確保大家都還能正常讀取

於是我把 儲存空間1 的資料,手動備份 到儲存空間2(資料夾名稱設為 (xxxxx-bak))
然後將儲存空間1的硬碟拆掉,再將資料夾名稱改回原來,這樣大家又很快又可以回復作業
再裝上新的硬碟,由於儲存空間2不能進行管理。
於是在新硬碟上建立儲存空間1 basic
再利用晚上加班,再進控制台->共用資料夾,將每個資料夾位置,都設定在儲存空間1
全部都移轉完成後,將儲存空間2刪除。
儲存空間1->管理新增硬碟建立Raid 1
跑了一天一夜的資料同步,再重新和副伺服器建立high-availability 叢集,又跑了1個晚上的資料備份。
今天早上總算恢復正常了,也架設了Raid1多一分保障
資料都還在,這段期間也沒有影響到同事作業太多,太感動了

後來舊硬碟拿到電腦上用HDtune測試都正常根本沒壞軌~"~
看了Synology國外板的官方論壇,還蠻多DSM 6.0.1的災情的,不知道有沒有人遇到相同問題
即便有架high-availability 叢集,但還是不能鐵齒一定要乖乖做RAID1,不然隨便有個BUG時簡直折騰人啊
資料移來移去一個心懸在那邊,根本沒辦法睡。

2016-07-29 11:19 發佈
做IT這行真的不要鐵齒

話說你已經拿便宜的synology來做資料sync了,就不要為了空間省raid搞自己

做的好沒人會感謝你

做不好死路一條砲你也是應該

我們在做SAN價格除了要客戶做4+1外

還要有另外一顆做異地備援及災難復原使用

若公司要省錢很抱歉風險就是公司全體一起承擔

這種玩法還是在Lab上玩玩就好

dorabeby wrote:
公司當初是使用兩台Synology 713+做high-availability 叢集
礙於經費問題,想說既然有high-availability 叢集,應該就不用做Raid這樣也有比較多儲存空間可用...(恕刪)


後面還沒有看完, 不過看到這裡就有點傻眼了. 如果連備份也沒有做, 這風險真的太大了.
FB: Pctine
電腦偵測不到壞軌,代表當下所有磁區都可以正常讀取
至於讀出來的資料到底對不對,那又是另外一回事了
沒道理電腦有辦法知道你原本寫了什麼東西下去
在偵測壞軌時還順便幫你驗證這樣
我在新公司兼職電腦系統的工作告訴我
1.啥更新,啥改版....沒有人員提出的時候...不要主動去做...成功,,沒有人懂 出錯...你就死定了
2.預見預防的事情不要做:公司ERP主機運作已經7年多(24*5).去年中把ERP主機系統ghost之後封裝移到另一台
測試看看可以服務否.避免重新建置的費用與停機(答案是沒問題)
結果被主管幹:你花時間搞這個? 你弄備用主機? 誰要你用? 原本的有故障嗎?

所以你的問題是 太積極...

空間不夠 再買就好

版本更新 有需要再更新就好

其他時間 不要碰系統
網路成癮患者啦
做IT不能省硬碟阿
省下來的錢老闆不會感激你 出事你可能不用待業界了
找工作絕對說你壞話 讓你死不超生
業界就有發生RAID5同時壞兩顆
要死不死備份到磁帶的資料又還原失敗
File Server的資料全數損毀
然後主管又決策把環境還原
繼續使用RAID5 也不會改用RAID6
就省下一顆硬碟錢等著下次再出包
小弟也是有被NAS突然掛掉給嚇到過!!
因為有問題第一時間就只能打0800 不斷慢慢地"按部就班!!"尋求技術支援
就硬體來看 NAS不管是主板還是電源供應器 電路板的LAYOUT及用料 相對PC架構 就是簡化版無誤
但是NAS 相對X86 PC SERVER ,還是有比較省電
dorabeby wrote:
公司幾乎有4/3的資料都在儲存空間1。...(恕刪)

三分之四的資料?這怎麼辦到的?
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?