内蒙古银行生产问题说明

1. 问题说明

1) 问题:生产上,非税系统隔一段时间(一般为10天左右)bank-adapt调用不到domain,或者是domain调用不到tomcat等问题,且登录生产服务器都登录不上,找到银行运维的监控,发现咱们服务器线程用满了,需要杀死服务,然后才能登录服务器,登录服务器重启咱们服务才正常;同一套服务测试环境不会出现此问题。
tomcat错误日志如下:
内蒙古银行出现(线程占满无法连接服务器) - 图1
Nontax-adapt日志如下:
内蒙古银行出现(线程占满无法连接服务器) - 图2
2) 因为测试环境不会出现问题,生产上频繁出现,起初怀疑是不是系统的性能不够,或者是网络原因,对这些进行了监控都没发现问题。
3) 最后发现了nontax-adapt的错误,是因为线程数打不开了,后来经查询是发现,liunxServer系统一般系统用户默认允许最大线程数数是1024,需要改到1万多,后来检查确实生产的参数是1024,测试环境的未16384
4) 解决:经查询分析,发现生产操作系统配置的允许最大线程数为1024,测试环境的为16384,生产上线程数不够,因此需要修改此配置。

2. 操作步骤

  1. 登录非税服务器root用户,执行下命令:
    vi /etc/security/limits.d/90-nproc.conf
    内蒙古银行出现(线程占满无法连接服务器) - 图3
    将1024修改为32000,修改后保存。
    2. 切换到非税服务所在用户,执行:
    ulimit –u
    查看修改后的允许最大线程数是否改掉。
    3. 重启非税所有服务,重启服务步骤参考重启服务文档。