服务器 频道

不准抖!服务器内有种很齐很齐的波叫“宁畅波”

  提起电磁波,总让人联想到电视机的雪花屏以及广播的沙沙声。原本强度、频率整齐的电磁波,因各种干扰变得不稳定导致视听不畅。

  在电子设备中,这种不稳定电磁波形成的高能波峰,便成为EMI(电磁干扰)对周边设备造成耗损。EMI一直被视为电子设备的隐形杀手,相比一般使用环境及产品结构。放置在数据中心的服务器内部空间小、敏感器件多、功率密度高、配电复杂,加之成千上万台服务器一起运转,庞大数量的电子设备使EMI问题更加突出。

  近日,新锐服务器厂商宁畅工程师,便就产品预研过程中如何解决服务器EMI问题公布了一种解决方案,宁畅工程师用各种办法,才将不稳定的电磁波变为“整齐”的“宁畅波”。

  宁畅信息产业(北京)有限公司(简称“宁畅”)是集研发、生产、部署、运维一体的服务器厂商,及IT系统解决方案提供商。宁畅可结合用户需求,提供全方位深入定制化服务。

  解决案例:

  问题:电磁干扰达250mV

  宁畅硬件工程师测试某主板系统100M CLK信号有叠加570kHz左右的周期性脉冲,信号上下叠加干扰峰值高达250mV,导致信号质量不符合SI Spec要求。图片如下:

  查找原因

  一、查看原理图,此信号是由100MHz CLK发生器经过Buffer输出至各PCIe Slave设备,测试发现CLK3有周期性干扰。测试Buffer输出其他信号,发现CLK1也有干扰,但是其他通道CLK信号此干扰很小,排除此Buffer芯片本身问题或芯片供电影响。

  二、查看PCB对比CLK信号走线差异,CLK2走线布在BOT层,CLK3走线布在BOT和内层。两组信号在BOT层走线没有太大差异,初步排除BOT层干扰。经过仔细检查,CLK3内层走线的上下两层是完整的GND参考层,走线间距满足手册要求,层内其他信号干扰也可排除。单独测试GND信号,发现有560kHz周期性干扰,初步定位干扰源。

  三、这种低频率噪声首先怀疑来源是开关电源的PWM信号。

  采用如下几种替代实验,来验证源头:

  通过以上实验可初步判断是合路缓起芯片工作中产生的干扰通过GND层耦合到了CLK信号。

  原因分析

  根据合路芯片规格书,查看其内结构框图,发现其有两路输出,OUT1输出链路没有经过PWM开关链路,中间只是经过一些MOSFET,其功能主要是均流作用,不是原因所在。而OUT2部分没有详细框图,从其Spec可以得到其开关频率典型值有两个:510kHz和480kHz。怀疑此部分电路为干扰源。

  寻找解决方案

  找到源头了,接下来就要解决问题。将此问题定位为EMI问题,通常解决办法有3种:

  1.抑制干扰源;2.切断耦合路径;3.保护被干扰源;

  实际分析、解决及验证过程:

  为降低噪声和干扰,增加滤波电容是一个可选的解决途径,尝试在输入和输出增加滤波电容实验结果如下:

  恢复问题板卡初始状态,将板卡安装至机壳,并通过多根粗线将板卡GND信号连到地。测试干扰大幅度减少,且接地线越多,干扰幅值越小,CLK信号干扰减小到50mV左右,在Spec要求范围内,问题解决。

  经验及反思

  1.在使用隔离电源的板卡中需要格外关注EMI问题。

  2.EMI问题解决手段有些是矛盾的,需要灵活合理利用。比如切断耦合路径需要去掉隔离电源两端的EMI电容,而抑制干扰源需要将EMI电容加上。

  3.因为测试环境与实际运行环境有些差距,导致测试结果不一定是实际运行结果,所以对部分测试结果要持怀疑态度。

  4. EMI干扰是共模干扰,单纯电容滤波难以解决。

  综上所述:在面对板卡调试的各种疑难杂症时,要学会多加思考和各种尝试,穷尽所有手段,在看似各种相互矛盾的解决办法中寻找合适的方案。

  5000项测试模型助降20%网建成本

  宁畅工程师介绍,在产品设计与研发阶段阶段,宁畅服务器内的每一块硬件板卡均经过严格的板级测试流程,包括:硬件PowerOn测试、PI测试、SI测试等,每个测试环节的监测项超过300个,覆盖并验证所有底层设计,为产品质量保驾护航。

  此外,为高效、高质量地完成客户需求的定制化服务器项目。宁畅整机测试部门,积累了5000项测试模型,并实现了“自动化”测试、自动在线数据采集分析等技术,全自动化测试程序将3至5日的工作缩短至20小时内,帮助客户降低网络建设成本20%,提高运维效率30%以上。

  除以上测试外,为保障定制服务器产品的稳定性,宁畅产品还需经过抗振动测试、抗干扰测试、碰撞测试、温湿度测试、耐腐蚀等近百项稳定性测试与优化。

  图说:宁畅2U双路机架服务器R620,历经上千项测试与优化

2
相关文章