那您除了懷疑機器爛以外可能也要擔心一下機房的電源系統

伺服器的power再爛...同時掛掉三五台的機率也實在很低吧
就算是雜牌機殼動物power都沒看過同時掛一堆的
好好檢查一下電源環境(or溫濕度)先吧

我們用的兩種IBM跟ASUS至少30餘台吧...
只有一台ASUS的POWER壞過(剛買來就壞)
不過ASUS那個電源跟RESET鍵真的有夠鳥...
按進去就會卡在裡面還要自己摳出來(買來就這樣)

買過三台三台都這樣

IBM就真的還滿好的~
之前IBM的人打電話來問機器有沒有問題
(假借售後服務之名行推銷新伺服器之實XD)
跟她說用五六年了都沒問題阿~她還有點不知道怎麼接話~哈
(其實剛進了6台X3550...所以也沒辦法再跟她買)
不過客服小姐超專業就是了

不管口氣、態度、專業度上~
都讓人感覺能在IBM上班果然不一樣(離題了)

像我公司對外服務一定是24小時*78,一旦停機超過30分鐘系統就得寫報告呈報給某個政府單位
為此,我們採取「只要是web service的機器」就進到虛擬化環境!後端機器就得買比較強壯的伺服器,我公司是採用IBM Blade,上面再擴充記憶體至32GB或64GB。
guest os是windows 2003,記憶體指派給其4GB。這樣規格的GUEST OS在每一部ESX上扛了4至5套guest vm,很少聽到user反應效能不好。(會反應不好的AP, 通常是他們程式寫的不怎麼樣。)
一般來說,VMWare建議2部硬體伺服器組成一個HA架構,一旦底層伺服器需要維修或上PATCH,
把伺服器上所有Guest VM 透過VMotion方式移到另一部刀鋒上,此時待維修的機器即可進行維修。
但如果GUEST VM數量多,我會建議使用3部或3部以上的ESX伺服器。
因為若在2台HA架構下,guest VM一旦增加到單一台ESX伺服器能承載極限,此時服務就會出問題!
因此有預算的話,就買3部機器!若沒有預算買且GUEST VM不多,可以考慮用2部ESX伺服器。
資料庫伺服器,原則上公司方面不願意架在vmware上!
資料庫交易量一旦大增,不單是資料庫受到影響,連帶其他非資料庫且同是在VMWare上的機器也會受到影響。
敗家是沒理由地…敗敗敗
claus950 wrote:
您先查查看...是不是x3650(還是x3250...有點小失憶) + ServeRAID 8K
當時我們在處理的時候也是百思不得其解
因為raid卡跟硬碟在ServeRAID Manager下面看都是正常的
但是就是沒辦法重建(raid已經crash了,但因為我們有BESR,所以先把raid建回來才是重點)
最後是原廠工程師來更新韌體
更新前工程師有先dump log來看...看完之後就說"先更新韌體試試看"
想當然爾,更新完就OK啦...(恕刪)
是X3650 + Serveraid 8K 沒錯。(一、兩年前的事了吧)
這問題在IBM網站上有公告,原因好像是大量傳輸資料時會crash。
解決方式是update raid card and backplane firmware 到一定版本以上就可解決;或是限制傳輸速度由3.0G 降為 1.5G 也可以。
內文搜尋

X