根据维基百科上的定义，负载均衡（Load Balance）是一种相当常见的计算机网络技术，用来对多个计算机（计算机集群）、网络连接、CPU、磁盘驱动器或其它资源进行分配负载，以达到优化资源使用、最大化吞吐率、最小化响应时间和避免过载的目的。

通常负载均衡可以分为硬件和软件负载均衡两类，这里主要说明 Nginx 在“软”负载均衡中的应用策略：内置策略和扩展策略。

内置策略包含加权轮询和ip hash，在默认情况下这两种策略会编译进nginx内核，只需在nginx配置中指明参数即可。
扩展策略有很多，如fair、通用hash、consistent hash等，默认不编译进nginx内核。

轮询算法

轮询算法是最简单的一种负载均衡算法。它的原理是把来自用户的请求轮流分配给内部的服务器：从服务器1开始，直到服务器N，然后重新开始循环。

算法的优点是其简洁性，它无需记录当前所有连接的状态，所以它是一种无状态调度。

简单配置如下：

http {  
    upstream cluster {  
        server a;  
        server b;  
        server c;  
    }  
    ...
}

加权轮询算法

轮询算法并没有考虑每台服务器的处理能力，实际中可能并不是这种情况。由于每台服务器的配置、安装的业务应用等不同，其处理能力会不一样。所以，加权轮询算法的原理就是：根据服务器的不同处理能力，给每个服务器分配不同的权值，使其能够接受相应权值数的服务请求。

简单配置如下：

http {  
    upstream cluster {  
        server a weight=1;  
        server b weight=2;  
        server c weight=4;  
    }  
    ...
}

按照上述配置，Nginx每收到7个客户端的请求，会把其中的1个转发给后端a，把其中的2个转发给后端b，把其中的4个转发给后端c。

加权轮询算法的结果，就是要生成一个服务器序列。每当有请求到来时，就依次从该序列中取出下一个服务器用于处理该请求。比如针对上面的例子，加权轮询算法会生成序列{c, c, b, c, a, b, c}。这样，每收到7个客户端的请求，会把其中的1个转发给后端a，把其中的2个转发给后端b，把其中的4个转发给后端c。收到的第8个请求，重新从该序列的头部开始轮询。

总之，加权轮询算法要生成一个服务器序列，该序列中包含n个服务器。n是所有服务器的权重之和。在该序列中，每个服务器的出现的次数，等于其权重值。并且，生成的序列中，服务器的分布应该尽可能的均匀。比如序列{a, a, a, a, a, b, c}中，前五个请求都会分配给服务器a，这就是一种不均匀的分配方法，更好的序列应该是：{a, a, b, a, c, a, a}。

ip hash策略

ip hash是nginx内置的另一个负载均衡策略，流程和轮询很类似，只是其中的算法和具体的策略有些变化。

配置如下：

http {  
    upstream cluster {  
        server a;  
        server b;  
        server c;  
        ip_hash;
    }  
    ...
}

每个客户端请求按访问ip的hash结果分配，这样每个访客固定访问一个后端服务器，可以解决session的问题。

fair（第三方）

fair策略是扩展策略，默认不被编译进nginx内核。它根据后端服务器的响应时间判断负载情况，从中选出负载最轻的机器进行分流。

这种策略具有很强的自适应性，但是实际的网络环境往往不是那么简单，因此须慎用。

配置如下：

http {  
    upstream cluster {  
        server a;  
        server b;  
        server c;  
        fair;
    }  
    ...
}

作者： Zealon
崇尚简单，一切简单自然的事物都是美好的。

Nginx 负载均衡策略

轮询算法

加权轮询算法

ip hash策略

fair（第三方）