群集–Haproxy搭建Web群集( Haproxy 功能及常用群集调度算法、Haproxy 常用配置及日志管理 、Haproxy 参数优化)

时间:2020-9-4 作者:admin


文章目录

Haproxy概述

Haproxy 是目前比较流行的一种群集调度工具,同类群集调度工具有很多,如 LVS 和 Nginx。相比较而言,LVS 性能最好,但是搭建相对复杂;Nginx 的 upstream 模块支持群集功能,但是对群集节点健康检查功能不强,高并发性能没有 Haproxy 好。Haproxy 官方网站 是 http://www.haproxy.org/。

Haproxy与LVS相比

  • Haproxy是一款可提供高可用性、负载均衡、及基于TCP和HTTP应用的代理的软件,特别适用于负载特别大的Web站点
  • 运行在当前的硬件上可支持数以万计的并发连接连接请求
  • LVS性能最好,但不支持正则处理,不能实现动静分离
  • 对于大型网站,LVS的实施配置复杂,维护成本相对较高

一、 Haproxy 功能及常用群集调度算法

Haproxy支持多种调度算法,最常用的有三种:RR(Round Robin),LC(Least Connections),SH(Source Hashing)

1.1 轮询 RR(Round Robin)

RR 算法是最简单最常用的一种算法,即轮询调度。例如,有 三个节点 A、B、C,第一个用户访问会被指派到节点 A,第二个用户访问会被指派到节点 B, 第三个用户访问会被指派到节点 C,第四个用户访问继续指派到节点 A,轮询分配访问请求 实现负载均衡效果。此算法还有一种加权轮询,即根据每个节点的权重轮询分配访问请求。

1.2 最小连接数 LC(Least Connections)

LC 算法就是最小连接数算法,根据后端的节点连接数大小动态分配前端请求。例如,有三个节点 A、B、C,各节点的连接数分别为 A∶4、B∶5、C∶ 6,此时如果有第一个用户连接请求,会被指派到 A 上,连接数变为 A∶5、B∶5、C∶6;第二 个用户请求会继续分配到 A 上,连接数变为 A∶6、B∶5、C∶6;再有新的请求会分配给 B, 每次将新的请求指派给连接数最小的客户端。由于实际情况下 A、 B、 C 的连接数会动态释放, 很难会出现一样连接数的情况,是目前用到比较多的一种算法。

1.3 基于来源访问 SH(Source Hashing)

基于来源访问调度算法,此算法用于一些有 Session 会话记录在服务器端的场景,可以基于来源的 IP、Cookie 等做群集调度。例如,使用基于源 IP 的群集调度算法,有三个节点 A、B、C,第一个用户第一次访问被指派到了 A,第二个 用户第一次访问被指派到了 B,当第一个用户第二次访问时会被继续指派到 A,第二个用户 第二次访问时依旧会被指派到 B,只要负载均衡调度器不重启,第一个用户访问都会被指派 到 A,第二个用户访问都会被指派到 B,实现群集的调度。此调度算法好处是实现会话保持, 但某些 IP 访问量非常大时会引起负载不均衡,部分节点访问量超大,影响业务使用。

1.4 常见的 Web 群集调度器

目前,常见的 Web 群集调度器分为软件和硬件。软件通常使用开源的 LVS、Haproxy、 Nginx,硬件一般使用比较多的是 F5。也有很多人使用国内的一些产品,如梭子鱼、绿盟等。

二、 Haproxy群集搭建

实验目的

Haproxy搭建Web群集,实现正常访问

实验环境

VMware软件
两台centos7虚拟机作为NGINX(IP地址:14.0.0.110 IP地址:14.0.0.177)
一台centos7虚拟机作为Haproxy(IP地址:14.0.0.107)

实验过程

1. nginx的手工编译安装

两台web服务器都要安装,以一台安装为例

[root@localhost ~]# iptables -F
[root@localhost ~]# setenforce 0
[root@localhost ~]# yum install -y pcre-devel zlib-devel gcc gcc-c++ make    ##安装环境包
将软件包拷贝到当前目录
[root@localhost ~]# useradd -M -s /sbin/nologin nginx   ##创建一个管理nginx的用户,不创建家目录,不能登录
[root@localhost ~]# tar zxvf nginx-1.12.0.tar.gz   ##解压软件包
[root@localhost ~]# cd nginx-1.12.0/
[root@localhost nginx-1.12.0]# ./configure --prefix=/usr/local/nginx --user=nginx --group=nginx     ##configure配置
[root@localhost nginx-1.12.0]# make && make install    ##编译安装
[root@localhost nginx-1.12.0]# ln -s /usr/local/nginx/sbin/nginx /usr/local/sbin/   ##建立软连接
为nginx创建一个首页便于测试
[root@localhost nginx-1.12.0]# vim /usr/local/nginx/html/test.html   ##这是web服务器14.0.0.110的测试首页
<h1>this is Hello web</h1>

web服务器14.0.0.117的测试首页    
[root@localhost nginx-1.12.0]# vim /usr/local/nginx/html/test.html
<h1>this is World web</h1>         
[root@localhost nginx-1.12.0]# nginx
[root@localhost nginx-1.12.0]# netstat -ntap | grep 80
tcp        0      0 0.0.0.0:80              0.0.0.0:*               LISTEN      14074/nginx: master            

群集--Haproxy搭建Web群集( Haproxy 功能及常用群集调度算法、Haproxy 常用配置及日志管理 、Haproxy 参数优化)
群集--Haproxy搭建Web群集( Haproxy 功能及常用群集调度算法、Haproxy 常用配置及日志管理 、Haproxy 参数优化)

2. Haproxy安装

Haproxy在负载均衡器上安装(14.0.0.107)
安装步骤

  1. 安装基础软件包
  2. 编译安装 haproxy
    要注意操作系统版本,是32位系统还是64位
  3. 建立 Haproxy的配置文件
  4. 创建配置文件目录/etc/haproxy
  5. 将源码包提供的配置文件样例 haproxy.cfg复制到配置文件目录中
[root@localhost ~]# iptables -F
[root@localhost ~]# setenforce 0
[root@localhost ~]# yum -y install pcre-devel bzip2-devel gcc gcc-c++ make    ##安装基础环境包
将软件包拷贝到当前目录下
[root@localhost ~]# tar zxvf haproxy-1.5.19.tar.gz
[root@localhost ~]# cd haproxy-1.5.19/
[root@localhost haproxy-1.5.19]# make TARGET=linux26    ##编译
[root@localhost haproxy-1.5.19]# make install   ##安装
[root@localhost haproxy-1.5.19]# mkdir /etc/haproxy  
[root@localhost haproxy-1.5.19]# cp examples/haproxy.cfg  /etc/haproxy/

# this config needs haproxy-1.1.28 or haproxy-1.2.1

global
        log 127.0.0.1   local0
        log 127.0.0.1   local1 notice
        #log loghost    local0 info
        maxconn 4096
#       chroot /usr/share/haproxy	'//固有目录,可注释掉'
        uid 99
        gid 99
        daemon
        #debug
        #quiet

defaults
        log     global
        mode    http
        option  httplog
        option  dontlognull
        retries 3
#       redispatch	'//注释'
        maxconn 2000
        contimeout      5000
        clitimeout      50000
        srvtimeout      50000
listen  webcluster 0.0.0.0:80	'//删除原本listen内容,添加一下内容'
        option httpchk GET /test.html	'//监听检查服务器的index.html文件(节点服务器的主页)'
        balance roundrobin	'//负载均衡调度算法使用轮询算法'
        server inst1 14.0.0.110:80 check inter 2000 fall 3	'//定义在线节点'
        server inst1 14.0.0.177:80 check inter 2000 fall 3
[root@localhost haproxy]# cd ~/haproxy-1.5.19/examples/
[root@localhost examples]# cp haproxy.init /etc/init.d/haproxy   ##启动脚本
[root@localhost examples]# cd /etc/init.d/
[root@localhost init.d]# chmod +x haproxy 
[root@localhost init.d]# chkconfig --add /etc/init.d/haproxy    ##添加到service管理
[root@localhost init.d]# ln -s /usr/local/sbin/haproxy  /usr/sbin/   ##建立软链接
[root@localhost init.d]# service haproxy start 
Starting haproxy (via systemctl):                          [  确定  ]
[root@localhost init.d]# netstat -ntap | grep haproxy 
tcp        0      0 0.0.0.0:80              0.0.0.0:*               LISTEN      13305/haproxy

Haproxy配置文件详解

Haproxy配置文件通常分为三个部分

  • global:为全局配置
  • defaults:为默认配置
  • listen:为应用组件配置
    global配置参数
  • log127.0.0.1 lcal0:配置日志记录,local0为日志设备,默认存放到系统日志
  • log127.0.0.1 loca1 notice:notice为日志级别,通常有24个级别
  • maxconn4096:最大连接数
  • uid 99:用户uid
  • gid 99:用户gid
  • defaults配置项配置默认参数,一般会被应用组件继承,如果在应用组件中 没有特别声明,将安装默认配置参数设置
  • log global:定义日志为global配置中的日志定义
  • mode http:模式为http
  • option httplog:采用http日志格式记录日志
  • retries 3:检查节点服务器失败连续达到三次则认为节点不可用
  • maxconn2000:最大连接数
  • contimeout5000:连接超时时间
  • clitimeout50000:客户端超时时间
  • srvtimeout50000:服务器超时时间
  • listen配置项目一般为配置应用模块参数
  • listen appli4- backup 0.0.0.0:10004:定义一个appli4- backup的应用
  • option httpchk /index.html检查服务器的index.html文件
  • option persist:强制将请求发送到已经down掉的服务器
  • alance roundrobin:负载均衡调度算法使用轮询算法
  • server inst1 192.168.114.56:80 check inter 2000 fall 3:定义在线节点
  • server inst2 192.168 114.56:81 check inter 2000 fall 3 backup:定义备份节点

3. 在win10虚拟机中验证

虚拟机中就配14.0.0.0网段的IP地址
群集--Haproxy搭建Web群集( Haproxy 功能及常用群集调度算法、Haproxy 常用配置及日志管理 、Haproxy 参数优化)
群集--Haproxy搭建Web群集( Haproxy 功能及常用群集调度算法、Haproxy 常用配置及日志管理 、Haproxy 参数优化)

三、 Haproxy日志管理

Haproxy 的日志默认输出到系统的 syslog 中,查看起来不是非常方便,为了更好地管理 Haproxy 的日志,在生产环境中一般单独定义出来。

  • 修改 Haproxy配置文件中关于日志配置的选项,加入配置:
    log /dev/log local0 info
    log /dev/log local0 notice
  • 修改 rsyslog配置,将 Haproxy相关的配置独立定义到
    haproxy.conf,并放到/etc/rsyslog.d/下
  • 保存配置文件并重启 rsyslog服务,完成 rsyslog配置
  • 访问网页并查看日志信息是否成功生成
[root@localhost init.d]# vim /etc/haproxy/haproxy.cfg
		log /dev/log    local0 info
        log /dev/log    local0 notice

群集--Haproxy搭建Web群集( Haproxy 功能及常用群集调度算法、Haproxy 常用配置及日志管理 、Haproxy 参数优化)

[root@localhost init.d]# cd /etc/rsyslog.d/
[root@localhost rsyslog.d]# vim haproxy.conf
if ($programname ==  'haproxy' and $syslogseverity-text == 'info')
then -/var/log/haproxy/haproxy-info.log
&~
if ($programname ==  'haproxy' and $syslogseverity-text == 'notice')
then -/var/log/haproxy/haproxy-notice.log
&~
[root@localhost rsyslog.d]# systemctl restart rsyslog.service    
[root@localhost rsyslog.d]# service haproxy restart 
Restarting haproxy (via systemctl):                        [  确定  ]
[root@localhost rsyslog.d]# ls /var/log/haproxy/    ##查看到了日志文件
haproxy-info.log  haproxy-notice.log

四、 Haproxy 参数优化

参数 参数说明 优化建议
maxconn 最大连接数 此参数根据应用的实际使用情况进行调整,推荐使用 10240,同时“defaults”中的最大连接数的值不能 超过“global”段中的定义
daemon 守护进程模式 Haproxy 可以使用非守护进程模式启动,生产环境建议使用守护进程模式启动
nbproc 负载均衡的并发进程数 建议与当前服务器 CPU 核数相等或为其 2 倍
retries 重试次数 此参数主要用于对群集节点的检查,如果节点多,且 并发量大,设置为 2 次或 3 次;在服务器节点不多的 情况下,可以设置 5 次或 6 次
option http-server-close 主动关闭 http 请求选项 建议在生产环境中使用此选项,避免由于 timeout 时 间设置过长导致 http 连接堆积
timeout http-keep-alive 长连接超时时间 此选项设置长连接超时时间,具体参考应用自身特点 设置,可以设置为 10s
timeout http-request http 请求超时时间 建议将此时间设置为 5~10s,增加 http 连接释放速度
timeout client 客户端超时时间 如果访问量过大,节点响应慢,可以将此时间设置短 一些,建议设置为 1min 左右就可以了
声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。