川流信息第三方硬件维保服务之DELL Compellent SC 4020 存储控制器抢修
川流信息第三方硬件维保服务之DELL Compellent SC 4020 存储控制器抢修
foreword
前言
前言
部署过传统架构虚拟化的IT朋友都知道,存储在虚拟化环境中是很重要的存在。因为是核心数据所在,同时承载核心业务,所以这些设备一般都是购买原厂维保。但是设备脱保以后,好多设备已经不支持原厂继续维保,或者出于性价比考虑,不少IT会考虑第三方硬件维保。此业务也是川流信息目前在全力推进的核心业务,下面我们结合一起真实的案例,给大家介绍下川流信息的第三方硬件维保业务。
Task received
接到任务
接到任务
上周五的10点,川流信息第三方IT硬件维保服务主管小杨突然接到公司服务台转过来的一个紧急需求:公司某技术维保客户所有虚拟机及文件共享服务全部停止。杨主管马上电话联系客户报修人,详细了解下来,该客户是某产业园一家物流公司,此次报修的服务器及存储承载的业务有财务、ERP等重要系统,本次故障对该公司IT业务系统已经造成严重影响。客户没有购买硬件服务,但是购买了我司虚拟化平台技术服务,本着客户服务优先的原则,时间紧,任务重,小杨带上专业工具,立刻驱车前往客户现场。
Fault analysis
故障分析
故障分析
到达客户现场后,发现客户虚拟化环境的服务器全部正常,后端存储故障灯闪烁,登陆管理界面发现,两个控制器已处于故障状态,如果下图:

为了进一步确认故障点,小杨马上连接上DELL Compellent SC 4020存储,进行故障勘察。经现场深层次分析存储状态,已确认服务器为无法连接状态,通过串口线连接查看,存储系统无法启动,重启后无法正常进入系统。小杨马上联系技术总监一起沟通故障,根据多年经验判定,大概率是控制器故障或者主控制器某部件故障(如主板,CF卡等)所致。
双控制器,主控损坏没有切换到副控,导致无法启动,串口连接副控制器无输出。
confirmation
备件型号确认
备件型号确认
- 首先确认存储型号:根据存储序列号查询为 DELL Compellent SC 4020 存储。
- 再确认备件:经查询,控制器备件为H7T18。
- 跟客户确认完后,我们紧急为这客户定制存储控制器(这里面也和客户沟通说明情况,控制器系统版本、授权等问题),下图为紧急购买的控制器整机备件。


Maintenance steps
维修过程
维修过程
- 上门更换主板前,跟客户约定上门时间,并带好所要用的工具,防静电设备(手环,手套等)。

2. 到达客户现场对存储所有的连接线,进行标注(以免接错),并拍照留底。


- 安装完成,连接好串口线,进行开机测试,观察存储控制器输出状态。
- 经过主副控制器数据同步,存储系统再经过3次重启后,才可正常进入系统,通过命令查看存储系统版本、授权、数据都正常,切换至副控制器,查看状态为正常。

6. 因主控制器更换,需通过命令配置控制器后端光纤接口。

- 所有操作完成后,在Dell Storage Manager Client管软件里查看所硬件状态,为正常。

Service completion sign-off
客户签字确认
本次服务虽然之前客户没有购买硬件维保服务,但是我们当着应急任务,认真对待,在极短时间内圆满完成了存储维修任务,减小了客户数据丢失的风险。客户表示:“在没有签署维保服务的前提下,川流信息高效地完成本次抢修任务,并且质量很高,很大程度上保护了我们的数据。我们对川流表示感谢,并期待和川流展开更多的合作!”客户随即帮忙签署IT服务单。

Conclusion
经验总结
- 更换存储控制器要考虑的东西比较多,技术要求比较高,先要做好功课,方法不出差错。
- 更换控制器,原来连接线不能接错,否则有可能造成不可逆后果。
- 更换前,要他仔细确认客户机器系统版本及授权(很重要)。
- 告知客户风险性,如果是控制器里CF卡损坏,会比较麻烦。
- 由于是传统虚拟化架构,本次排错涉及到光纤交换机设置,供应商的综合技术能力比较重要。
在短短48小时内,我们出色完成了保外客户存储的检测、备件采购、维修的一条龙服务,迅速高效的完成了客户交给我们的任务,同时为本次应急任务画上了圆满的句号。川流信息IT外包服务本着“快速服务,快乐体验”的服务理念,并承诺认真做好每一次服务,一丝不苟的对待每一位客户!