【IT168 评论】解读一年一度的双十一购物狂欢节,可能我们更多的只是看到网民疯狂的抢购场景与国内各大电商平台巨大的订单量,却很难想到电商网站背后遭遇的网络瘫痪之隐忧。回想2013年的双十一,淘宝与京东商城的网站访问量较平时增长了200%之多,暴增的用户流量以及复杂数据交互导致服务器崩溃,给网民购物体验带来了巨大影响。
而去年双十一电商们的疯狂促销活动有增无减,成交额更是突破以往数据记录,一路攀升,面对如此巨大的网站访问量和高效数据处理能力的挑战,商家如何确保服务器快速稳定的运行呢,这也是我们要跟大家讨论的话题。
为了帮助大家对电商平台运维和管理有所了解,并通过电商在双十一的促销来分析电商系统的承载能力究竟如何,小编特意采访了某IT网站IT运维经理王伟及戴尔公司互联网解决方案团队资深经理尹玉峰,一同探讨高并发平台痛点的解决之道。
快速响应故障和紧急调整是最大的挑战
据该IT网站的IT运维经理王伟表示:“随着云计算的普及和云技术的成熟,我们公司已经迈入了私有云。”
那么私有云环境是如何实现的呢?王经理告诉我们,公司的基础架构以机架式服务器为主,但核心业务都已经成功实现虚拟化了。
在硬件方面,我们把核心业务承载在戴尔R910服务器上,R910作为虚拟化数组,根据公司业务的规模,目前配有两台戴尔R910,后期可能随着业务的增多,后续还会再部署两台。在存储方面使用的是戴尔EqualLogic PS系列,备份方面使用的是戴尔的高性价比的Power Vault MD系列的产品。
在操作系统方面,一直是以微软的Window为平台,从Windows Server2000就开始使用,像一些论坛的应用使用的是开源的系统,虚拟化方面也是使用的微软的Hyper-V。
那么入云前后有哪些实质性的变化呢?王经理表示,入云之后跟入云之前相比在成本方面至少能降低70%以上,虽然性能略有下降,但在功能方面完善的更加出色。在机房规模方面,服务器数量减少了100多台,从原有的4列一列8机柜到现在只需2列一列8机柜,数量减半,更加的节约了机房的空间,同时对于绿色节能也有了更好地提升。
那么在高并发高流量到来的同时,给服务器的运维和管理带来了哪些挑战?
王经理表示,运维和管理需要更快速的应对变化和各种突发情况。比如,运维系统需要支持快速扩容,对新加入的节点需要自动的纳入监控,应用系统也需要快速的部署到新节点上,负载均衡设备也能够自动发现。
网络管理上能够根据应用系统的实际流量,快速和合理的安排网络节点拓扑的变更。网络入口能够根据情况对关键系统流量进行隔离保护。软件架构上,需要能够支持快速降级、限流、分流、灾备切换。管理上,各个系统和部门的协调是一个比较大的挑战。
据王经理表示:“在高流量的情况下,服务器需要大规模调整和频繁调度部署,快速响应故障和紧急调整是最大的挑战。我们要提前做好系统架构,才能在调整中相对顺利进行。”
新一代戴尔PowerEdge服务器支招电商平台
针对此事,小编还特意采访了戴尔公司互联网解决方案团队资深经理尹玉峰,让我们来看一看戴尔服务器是如何帮助电商平台简化运维和管理的呢?
据尹经理介绍,在2014年9月,戴尔基于英特尔E5-2600 v3处理器平台的新一代戴尔PowerEdge服务器正式发布。首批新一代戴尔PowerEdge服务器包括了PowerEdge R730xd、R730和R630机架式服务器、M630刀片式服务器和T630塔式服务器。这些产品将作为承载主流应用的计算平台,覆盖绝大部分行业客户市场需求。戴尔强调,新一代戴尔PowerEdge服务器的改进设计都来自客户的需求。
从1994年戴尔PowerEdge服务器诞生,到新一代戴尔PowerEdge服务器诞生,戴尔PowerEdge服务器品牌已经走过了整整20年。随着新一代戴尔PowerEdge服务器的发布,新产品的性能有了全新的变化,但不变的是产品优良的品质;新产品的设计有了全新的变化,但不变的是易用的理念。
针对某IT网站IT运维经理王伟提出的如何简化系统管理的问题,戴尔尹玉峰表示:新一代戴尔PowerEdge服务器的一个更新亮点就是简化系统管理。
根据戴尔的一项调研,60%的IT经理表示通过IT资源分配来降低运营复杂性和简化数据中心管理是他们优先工作。此外,随着英特尔平台的逐步集中化和标准化,服务器厂商的创新价值也的确更多的体现在软件层面。这方面,戴尔也的确提供了众多的创新功能。例如更高的自动化管理功能,让管理员能够在任何地方使用任何手持设备监测和修复数据中心的情况。
此外,戴尔OpenManage系统管理产品组合还提供增强的服务器本机管理。戴尔推出的iDRAC Quick Sync,是第一个支持NFC的服务器,通过运行OpenManage Mobile的手持设备,就能传输服务器健康和基本服务器设置信息。OpenManage Mobile还让管理员能够随时随地使用移动设备来监测和管理环境。此外,管理员可以通过零接触自动部署,大幅节约时间并提高效率,戴尔的零接触资料管理器(Zero-Touch Repository Manager)和自动更新功能将固件更新时间缩短了92%。
新一代戴尔PowerEdge服务器的核心设计思路之一,就是简化服务器,特别是规模化数据中心的:设备生命周期管理流程,将复杂的服务器部署、配置和修改工作,尽可能的批量化、自动化和零人工化,其核心围绕着预配置、规模化部署以及iDRAC、OpenManage展开。
比如说这一代服务器中的配置用USB接口可以通过标准USB线缆连接PC、笔记本、平板电脑及手机,直接从这些个人设备上传递服务器配置数据,这意味着管理员在更新服务器时可以直接通过手持设备独立的、自动化的进行更新(这一技术被称为iDRAC Direct)。如果管理员需要自动化扩展到千台甚至更多的服务器,可以使用XML配置资料实现。
同时,戴尔强化了实时故障报告和故障排除系统、简化服务器启动流程及自检程序,其宣称这将缩短故障排除时间73%,启动时间缩短45%,而全自动化的固件更新可以减少约61%的部署固件和BIOS更新时间。
此外,戴尔引入实时服务器性能监测和SAS存储健康监测,且无需针对服务器性能监测的软件代理,并且SDS解决方案的实时健康监测比软件代理更加可靠。
写在最后,王经理也针对如何选购服务器的问题上,为更多的用户提出了一些切实可行的采购建议:选择高可用性的服务器乃基本要求;制定服务器宕机救急方案;活动促销期间需管理人员不间断驻守,商家们进行节日促销活动时,需要派遣专业有经验的管理人员驻守在公司数据中心机房,时刻关注服务器的运行状态和网站性能的检测,一旦发现问题能够冷静快速的解决,确保服务器稳定正常的运行。