搜索你想要的: 关键字:   
中文版
新闻中心
信息搜索
关键字:
范 围:
首页新闻中心 技术文章
 
十大X86服务器常见故障---硬件(二)
新闻来源:互联网    点击数:2493    更新时间:2011/1/17 9:42:39    收藏此页

Top 4 RAID



故障回放:某企业更换新的数据中心,服务器需要逐步迁移,一台文件服务器成为先行者。这是一台采用的RAID1容灾策略的服务器,迁移过程中没有任何问题,但是使用不久一次雷暴天气后服务器异常关闭,经检测防雷系统并没有起到应有的作用,导致服务器两块硬盘同时损坏。


解决方案:对于RAID1来说,只能允许一块硬盘的损坏,当2块硬盘同时损坏后,数据将全部丢失,对于RAID3、5来说同样如此;而对于RAID6,虽然支持两块硬盘同时掉线,但是第三块盘再度掉线后,系统将也将全面崩溃!


上述故障数据将是不可逆性恢复,由此可见RAID技术虽好,仍有一些弊端,因此对于极其重要的服务器我们不仅仅要做出RAID的策略,还要将核心数据同步备份到其他介质,比如:磁带、磁盘等。


危害程度:★★★☆


控制难度:★★★★☆


综合评定:★★★★


Top 3 主板



故障回放:根据日志的记录,Wsus服务器在凌晨2点宕机了,回滚当日监控录像和环境记录,没有任何异常,起初怀疑是病毒或者策略等软件因素造成的意外状况,但是重启服务器时却是另外一番景象。


开机→风扇转动,电源模块指示灯狂闪→尚未自检,随即再次启动→电源模块指示灯再次闪烁,如此周而复始。


解决方案:更换CPU、内存插槽,更换电源模块,插拔硬盘,故障依旧,将这些设备放置到同型号的服务器上,没有任何问题。于是怀疑主板损坏,联系厂家工程师,经检测确实是主板故障,更换主板后恢复正常。


同CPU一样,主板的故障率是比较低的,但是它的危害程度却远高于CPU,对于多路服务器来讲,单一CPU的损坏并不会影响整个服务器的运转,我们失去的或许只是性能和速度;而对于主板,它几乎没有替代品,只能依靠厂家的更换,因此它的危险性较高。


危害程度:★★★★


控制难度:★★★★★


综合评定:★★★★☆


Top 3 主板



故障回放:根据日志的记录,Wsus服务器在凌晨2点宕机了,回滚当日监控录像和环境记录,没有任何异常,起初怀疑是病毒或者策略等软件因素造成的意外状况,但是重启服务器时却是另外一番景象。


开机→风扇转动,电源模块指示灯狂闪→尚未自检,随即再次启动→电源模块指示灯再次闪烁,如此周而复始。


解决方案:更换CPU、内存插槽,更换电源模块,插拔硬盘,故障依旧,将这些设备放置到同型号的服务器上,没有任何问题。于是怀疑主板损坏,联系厂家工程师,经检测确实是主板故障,更换主板后恢复正常。


同CPU一样,主板的故障率是比较低的,但是它的危害程度却远高于CPU,对于多路服务器来讲,单一CPU的损坏并不会影响整个服务器的运转,我们失去的或许只是性能和速度;而对于主板,它几乎没有替代品,只能依靠厂家的更换,因此它的危险性较高。


危害程度:★★★★


控制难度:★★★★★


综合评定:★★★★☆


Top 1 不明原因的故障


 


故障回放:有故障现象,无故障原因


解决方案:类似的事情有很多,比如说系统蓝屏,可能是软件冲突,也可能是病毒,还可能是内存,亦有可能是主板电容爆掉……,面对这种故障我们很难第一时间与以判断,这个时候我们就需要在综合的角度进行考量。


首先重装系统,排除软件的故障;然后,逐一替换系统硬件,排除硬件故障的可能性;如问题依旧就需要考察服务器的应用环境是否正常,比如电力供应是否满足需求,温湿度是否在正常指标之内,机房的洁净度是否合规,服务期内的灰尘是否太多等等。很多时候故障出现的时间并不固定,短则几分钟,长则数天,没有任何规律,对于我们排错和控制造成了很多麻烦,但是细心+耐心总能找出问题的关键点,最终解决。


危害程度:★★★★★


控制难度:★★★★★


综合评定:★★★★★

总页数:1  第  1    页 

上一篇:交换机背板带宽计算方法   下一篇:十大X86服务器常见故障--硬件(一)
【刷新页面】【加入收藏】【打印此文】 【关闭窗口】
 
深圳市金宇汇科技有限公司 © 2008-2030 版权所有 粤ICP备09007441号
电话:+86 0755-82885853 传真:+86 0755-82885611 地址:广东省深圳市福田区福华路福田市场大厦5B08室