川流信息第三方硬件维保服务之DELL R740硬盘故障抢修
川流信息第三方硬件维保服务之
DELL R740硬盘故障抢修
各位IT朋友都知道,数据中心设备包括服务器,存储,网络设备等,因为承载业务很重要,所以这些设备一般都是购买原厂维保。但是设备脱保以后,好多设备已经不支持原厂继续维保,或者出于性价比考虑,不少IT会考虑第三方硬件维保。此业务也是川流信息目前在全力推进的核心业务。下面我们结合一起真实的案例,给大家介绍下川流信息的第三方硬件维保业务。
Accept the task
接到任务
上周五的10点,川流信息第三方IT硬件维保服务主管小杨突然接到公司商务转过来的一个紧急需求:园区某医疗行业客户的一台服务器突然性能下降并影响使用,同时服务器前面板有黄灯闪烁现象。杨主管马上电话联系对方报修人,详细了解下来,该客户是一家集医疗器械研发,制造,营销等于一体的综合性公司,此次报修的服务器承载的业务有财务,ERP等重要系统,本次故障对该公司IT业务系统已经造成严重影响。时间紧,任务重,小杨带上专业工具,立刻驱车前往客户现场。
Fault Analysis
故障分析
到达客户现场后,发现用户使用的设备是我们熟悉的 DELL PowerEdge R740 服务器,同时故障现象为2槽位硬盘 琥珀色灯闪烁。如下视频:
为了进一步确认故障点,小杨马上启动专业工具连接DELL BMC-iDRAC,进行故障勘察。另:iDRAC没有提前配置情况下,默认为DHCP模式。所以需要一个DHCP模拟器给服务器发放IP地址。如下图:
▶DHCP模拟器

▶登录iDRAC

通过iDRAC确认为2号槽位硬件物理故障,通过收集日志,进一步确认问题。通过平台可以看出,用户4块硬盘做了RAID 5。


通过日志分析,确定为2号槽位硬盘故障,且问题在12月15日已经发生。

communication
维修沟通
故障确认完毕,杨主管马上和客户沟通,本次故障为硬盘故障,并和客户交底。客户要求马上采购一块硬盘替换,而我们建议客户采购两块硬盘,一块用于raid5数据重建,一块用于全局热备。因为客户没有数据备份,所以这样做会更保险,因为raid 5的机制是可以坏一块硬盘,如果再加上一块热备盘,可以多一块冗余盘,从而争取更多的抢修时间。客户听取了我们的建议。以下为交底图:

Process
维修过程
故障和维修方案确认后,杨主管马上查询公司库存是否有备件。因为该客户不是公司维保客户,所以暂时没有备件,小杨立刻启动内部采购流程并得知硬盘第二天能到货,我们通知客户维修时间。硬盘到货后,我们立刻按约定好的时间上门更换。如下图:
▶此为采购到的全新硬盘

▶维修前佩戴专业静电手套

▶安装前再次确认硬盘型号

▶硬盘更换后,故障灯消失

再次通过收集日志并分析,此前故障的2号槽位硬盘已经恢复正常。

▶最后在系统里设置热备盘

Sign-off
客户签字确认
本次服务虽然之前客户没有签署维保服务,但是我们当着应急任务,认真对待,在极短时间内圆满完成了服务器维修任务,减小了客户数据丢失的风险,并给出了客户合理的优化建议。客户表示:“在没有签署维保服务的前提下,川流信息高效的完成本次抢修任务,并且质量很高,很大程度上保护了我们的数据。我们对川流表示感谢,并期待和川流展开更多的合作!”客户随即帮忙签署服务验收单。

Conclusion
总结
在短短24小时内,我们完成了保外客户服务器的检测,采购,维修工作,迅速高效的完成了客户交给我们的任务,同时为本次应急任务画上了圆满的句号。川流信息IT外包服务本着“快速服务,快乐体验”的服务理念,并承诺认真做好每一次服务,一丝不苟的对待每一位客户!