服务器 频道

Linux架构稳定、可用、高效的负载均衡系统

  【IT168 服务器学院】利用Linux架构高稳定、高可用、高效率的负载均衡(Load balancer)系统

  引言:
  Linux在网络方面具有很强大的功能。可以用Linux架构Firewall(防火墙), IDS(入侵检测),Cache&Proxy,大型的mail 系统,
  甚至高端的路由器等,无所不能。本文介绍Linux在负载均衡方面的应用和具体的实现。本文的前半部分主要是一些理论的说明及所用
  组件的简要介绍,后半部分是具体的实现,包括软件的安装、配置和启动。本文的内容是本人实验得来的,难免有疏漏,请各位谅解!

  本文的目标:
  本文的目标是实现一个由两台Linux Load balancer(LLB)和三台web服务器组成一个web服务器群,这个服务器群对用户来说就好象
  是一台服务器。LLB对三台web服务器进行负载均衡。并且当web服务器出现故障时LLB会自动将出现故障的web服务器从服务器群中剔除,
  当web服务器的故障修复后LLB会自动将web服务器加入到服务器群中来。其中两台LLB一台为主(Master LLB),一台为附(Slave LLB),
  当Master LLB出现故障以后,Slave LLB会自动接管Master LLB的所有工作。系统结构如图所示。

  client
  ________|__________
  | |
  | |
  Master LLB Slave LLB
  | |
  |_________________|
  |
  HUB
  ____________|_______________
  | | |
  | | |
  webserver1 webserver2 webserver3

  理论的说明及所用组件的简要介绍:
  我们这里的所实现的负载均衡是以 http://www.linuxvirtualserver.org/ 项目的 ipvsadm 为原型,配合以其他的一些开源软件来实现的。
  在这里,我们需要四个组件:
  · ipchains
  · ipvsadm, (http://www.linuxvirtualserver.org/)
  · keepalived, (http://keepalived.sourceforge.net)/
  · heartbeat , (http://www.linux-ha.org/)

  ipchains
  ipchains是Linux下很有名的Firewall软件,ipchains在Linux的内核中对进出Linux的数据进行控制,包括数据包的过滤和伪装等。
  在Linux的内核中有三条标准控制数据包去向的链:input , forward , output 。input是对进入Linux的数据包进行控制,forward是
  对路由的数据包进行控制,output是对出Linux的数据包进行控制。网上有不少关于ipchains的文章,在Linux的2.4.0版本的内核中用
  的是iptable。在我们的这个方案中ipchains的作用是将用户的请求数据交给ipvsadm来处理,并由ipvsadm决定用户的请求数据最终由
  哪台web服务器来相应。大家也可参考IPCHAINS-HOWTO。在此不多说。

  ipvsadm(http://www.linuxvirtualserver.org/)
  ipvsadm是由中国的年轻黑客维护的,他是从ipportfw发展而来的。ipvsadm是在Linux的内核中实现的,他在Linux的内核中监测需
  要路由的IP数据包,ipvsadm根据用户设置的条件对数据包进行相应的操作。了解ipchains的用户知道,在Linux的内核中有三条控制数
  据包去向的链:input , forward , output,ipvsadm是在forward的过程中对数据包进行操作的。ipvsadm的作用是为用户选择合适的
  web服务器。LLB在选择服务器时有四种不同的规则,这四种规则用于选择哪台服务器处理用户的请求。这四种规则是:Round-Robin (RR)、
  Weighted Round-Robin (WRR)、 Least-Connection (LC)、 Weighted Least-Connection (WLC)。这四种规则各有自己的适应环境。

  Round-Robin:

  如果您的LLB选用的是这种算法,她会将数据包均匀的分发给各台服务器,他把所有的服务器放在相等的地位上,而不会实际的去考
  虑各台服务器的差异,如响应时间、session数等!例如您有ABC三台服务器,那么LLB分发数据包的顺序是......ABCABCABC.....
  Round-Robin算法的好处是简单、占用系统资源少,缺点是无法检测哪台服务器有更高的响应速度、更少的连接,所以他非常适合服
  务器性能相当的环境。

  Weighted Round-Robin
  这种规则适用于用户扩展系统时,因为这是集群中的服务器的性能会有较大的差别,为每一个服务器定义一个参数是必要的。
  这是一种带参数的Round-Robin的算法,参数的名字叫Weighed。您可以根据您的服务器的处理能力来为每一台服务器分配一个
  Weighted值,值越高其优先程度越高,默认值是1。例如:你有三台服务器,分别为A:486、B:奔腾、C:奔腾2,你可以为他们分配
  Weighted值为:1、2、3,则按照Weighted Round-Robin的算法处理数据包的服务器的顺序是:CCCBBBA
  Round-Robin可以说是Weighted Round-Robin的一种特殊情况,既所有的服务器有相同的Weighted值。

  Least-Connection

  这是一种动态算法,LLB将根据每台服务器当前的连接数目来转发数据包,具有最少连接的服务器将处理下一个请求。这一种算法能很好
  的分配各种流量,对于突发的请求或大量的请求能够做出比较平滑的处理,不会产生将请求的数据发往同一台服务器的情况。

  Weighted Least-Connection

  这种算法是Least-Connection Scheduling的一种扩展,她为每一台服务器分配一个weighted值,然后根据这个值和每台服务器当前状态
  下的连接数来决定由谁来处理用户的请求。可以举一个例子来说明她的工作原理:
  假设有n台服务器,每一台服务器的weighted值为Wi ( i=1,2. . . n) ,session为Ci (i=1,...n), ALL-CONNECTIONS 是所有服务器
  的session和,既C1+C2+....+Cn.,那么按照下面的算法,服务器j将处理下一个请求:
  ( Cj/ALL-CONNECTIONS )/Wj=min { (Ci/ALL-CONNECTIONS)/Wi } ( i=1,..,n)

  也可以简化为:
  Cj/Wj = min { Ci/Wi } (i=1,..,n)

  我们可以对这四种算法做一个比较,Round-Robin和Weighted Round-Robin是静态的方法,对于服务器的当前状态不能做出很好的估计,
  因此数据的分配并不是最合理。
  但在服务器的性能相当时Round-Robin却是最好的选择。Least-Connection 和Weighted Least-Connection是动态的方法,可以对服务器
  的当前状态做出比较合理的估计,这样在平衡各台服务器时,可以做出比较优化的选择。

  Keepalived
  keepalived是一个类似于layer3, 4 & 5交换机制的软件,也就是我们平时说的第3层、第4层和第5层交换。Keepalived的作用是检测web
  服务器的状态,如果有一台web服务器死机,或工作出现故障,Keepalived将检测到,并将有故障的web服务器从系统中剔除,当web服务器
  工作正常后Keepalived自动将web服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的web
  服务器。

  Layer3,4&5工作在IP/TCP协议栈的IP层,TCP层,及应用层,原理分别如下:

  Layer3:Keepalived使用Layer3的方式工作式时,Keepalived会定期向服务器群中的服务器发送一个ICMP的数据包
  (既我们平时用的Ping程序),如果发现某台服务的IP地址没有激活,Keepalived便报告这台服务器失效,并将它从服务器群中剔除,
  这种情况的典型例子是某台服务器被非法关机。Layer3的方式是以服务器的IP地址是否有效作为服务器工作正常与否的标准。在本文中
  将采用这种方式。

  Layer4:如果您理解了Layer3的方式,Layer4就容易了。Layer4主要以TCP端口的状态来决定服务器工作正常与否。如web server的服务
  端口一般是80,如果Keepalived检测到80端口没有启动,则Keepalived将把这台服务器从服务器群中剔除。

  Layer5:Layer5就是工作在具体的应用层了,比Layer3,Layer4要复杂一点,在网络上占用的带宽也要大一些。Keepalived将根据用户的
  设定检查服务器程序的运行是否正常,如果与用户的设定不相符,则Keepalived将把服务器从服务器群中剔除。

  Heartbeat
  heartbeat在前面我们简要的说明了一下,两台LLB可以互为备份,这个工作就是由heartbeat来完成的。Heartbeat的中文是
  “心跳检测”。Slave LLB利用heartbeat来检测Master LLB的当前状态,当Master LLB不能工作时(如:down机)
  Slave LLB通过heartbeat来接管Master LLB的所有工作,这个接管过程在10秒以内完成,对用户来说没有什么察觉。
  Heartbeat中包含一个IP take over(IP 地址接管)的功能,此功能是通过ARP欺骗的手段来完成的。

0
相关文章