不過說真的, 如果知道是電源壞了, 請說出電源的品牌, 因為大家都知道技嘉的電源是貼牌的,而系統用的電源應該連貼牌都不會貼(因為要花一筆安規貼牌費), 但是系統如果是技嘉整台組好兜售的,那耐用性測試看來是沒做好吧....這點就有點
我之前服務的公司所用的SERVER 80%都是用HP的,機型都是COMPAQ系列,光DL-380 G2~G5差不多有將近100部,HP本身是做醫療儀器起家的,自從HP併購COMPAQ後HP SERVER的品質提升了不少,我們每部SERVER的散熱風扇都加到齊全,POWER都上二顆,另外AC供電部分都經過APC UPS,UPS前還有一道防突波、雷擊設備,我認為只要是需要吃電的設備,電源的乾淨度及穩定度對設備的壽命是有幫助的,現在的POWER設備對台電的供電都有起到一定的濾波、穩壓作用,如果這工作能夠在POWER的前一級加強的話,相對POWER的壽命應該會長一些,就好像人體對水的需求,雖然人體的某些器官對飲用的水會有一定的過濾作用,但如果水源是乾淨無汙染的,人體的器官相對就會更健康。
會壞就會壞哪有甚麼牌子不會壞 什麼牌子會壞都會壞啦 這世界上有超人嗎?EMC還會燒咧傻傻的重點是要想到壞掉後要怎麼修理吧還有要花多久時間修理客人能忍受多久時間不發瘋如果一分鐘都不能忍最好不要太相信運氣 品牌這種東西
基本上這個問題我們IBM工程師有一次來幫我們為修一台x3650的時候也有說過..還蠻尷尬的當時...呵呵...新機器一拆機上ram開機就亮RAID燈...RAM也秀斗秀斗會抓不到...不過當時是拿創建的,所以就丟回去換了再說!!...工程師一來就是先把所有的韌體都更新一次,然後就說好了!!@@如果還有問題直接換新機...結果還真的就沒有那些靈異事件了...蝦咪網路瞬斷有的沒的...可是結果是重開機從10分鐘要延長到15分鐘(個人感覺)..變超久......IBM的回覆也是說...因為當初的韌體抓太快常常會lose某些HDD...所以更新後會抓比較久..不過我們3x台x3650...從此之後就頭好壯壯就是了....PS:順便一問...IBM後期的server是不是比較不耐熱阿...在機房的櫃子理...推疊到熱當...有誰家的也常常這樣..
我公司剛好就做這兩家的ODM...(應該猜得出來是什麼哪一家了)做sever的應該很少會沒有跑stress 或是可靠度測試除非他們沒有PA部門lordkon wrote:server也敢用國產的台灣的server很少會去測壓力測試,因為太花時間也花精力雖然台灣廠商也有幫大廠代工,但品質真的是有差公司的30多台dell.hp.serveru用了1~7年,也沒聽說Power掛點
Hells wrote:基本上這個問題我們I...(恕刪) 您算運氣好的,還沒上機就發生問題我們是運行一年多才出包,慘的是上面還有web的資料庫還好環境中有建構BESR,才能在3小時內搞定服務停止時也用另一台VMWare ESXi先異機還原,保持服務運作不過我倒是覺得IBM的說法有很大的成分是唬爛的(因為他也這樣跟我說...XD)反正更深層的東西...工程師可能也不了解吧IBM的新機...多新??如果是M2的話...目前沒遇過有熱當的問題不過也只有那間機房,而且才5台堆疊而已...樣本數有點小應該IBM的新伺服器都已經45nm了...不太可能會有熱當的問題吧
剛剛將故障還有剩下的機器power都更換掉了,希望別再出問題了看了大家的討論,感覺安全跟品質是用錢堆出來的,這錢好像也省不了,經過這一次我想是應該再多買一些機器當保險用,但是多買機器就真的安全嗎? 頭痛苦腦中啊......
機器在怎麼貴..DM說的可用性有多高..會掛就是會掛啦..@_@公司HP, IBM, DELL, Supermicro都有..不過現在最多的是DELL.之前在上一家公司..系統當了..我們這些小工程師趕快從家裡趕過去換就好可是現在這家公司就不能夠允許這樣子玩..這樣子玩等著被砍頭蔣大遇到的問題..其實可以分幾個面向啦..先看看這系統掛點的時候.最多可以容忍多久時間掛點以單純硬體的問題..我們公司是買24x7x4 當保險啦真的有問題.四小時備料就送過來不過有些系統連五分鐘都不能停.這時候四小時的備料機制就不足以符合我們的需求此時就要開始討論HA機制..比如說虛擬化就是其中的作法..不過也不見得所有東西都適合虛擬化..不適合虛擬化的.如DB.就真的要砸錢準備兩套系統預防萬一了我們都是跟老闆說.只買一套的狀況下.掛點時我們預計至少要幾個小時才能夠讓系統上線.如果要減少到多少時間.預計要多花多少coco..讓老闆去選擇千萬不要自己想說為公司省錢.出事的時候老闆只會怪你當初為什麼沒跟他講這風險但是上面指的是..工程師知道或是被通知發生問題.一直到修復完成的時間假設工程師都不知道出事這段時間該怎麼辦?有可能工程師到了公司上班才發現網站已經掛了一個晚上我們的解法是一個是架設monitoring系統.在每個環節都設立偵測點..並設定有問題可以傳簡訊或是現在常看到的push mail.這樣就可以縮短從問題發生到問題開始被解決的時間其實HA是一門學問.也是一門藝術..可以玩的花樣也不盡相同..每個公司可利用的資源也都不同..大家作法都不一樣啦