Java
HttpClient优化思路:

  1. 池化
  2. 长连接
  3. httpclient和httpget复用
  4. 合理的配置参数(最大并发请求数,各种超时时间,重试次数)
  5. 异步 6、多读源码

    1、背景

    有个业务,会调用其他部门提供的一个基于http的服务,日调用量在千万级别。使用了httpclient来完成业务。之前因为qps上不去,就看了一下业务代码,并做了一些优化,记录在这里。
    先对比前后:优化之前,平均执行时间是250ms;优化之后,平均执行时间是80ms,降低了三分之二的消耗,容器不再动不动就报警线程耗尽了,清爽~

    2、分析

    项目的原实现比较粗略,就是每次请求时初始化一个httpclient,生成一个httpPost对象,执行,然后从返回结果取出entity,保存成一个字符串,最后显式关闭response和client。一点点分析和优化:

    2.1 httpclient反复创建开销

    httpclient是一个线程安全的类,没有必要由每个线程在每次使用时创建,全局保留一个即可。

    2.2 反复创建tcp连接的开销

    tcp的三次握手与四次挥手两大裹脚布过程,对于高频次的请求来说,消耗实在太大。试想如果每次请求需要花费5ms用于协商过程,那么对于qps为100的单系统,1秒钟就要花500ms用于握手和挥手。又不是高级领导,程序员就不要搞这么大做派了,改成keep alive方式以实现连接复用!

    2.3 重复缓存entity的开销

    原本的逻辑里,使用了如下代码:

    1. HttpEntity entity = httpResponse.getEntity();
    2. String response = EntityUtils.toString(entity);

    这里相当于额外复制了一份content到一个字符串里,而原本的httpResponse仍然保留了一份content,需要被consume掉,在高并发且content非常大的情况下,会消耗大量内存。并且,需要显式的关闭连接,ugly。

    3、实现

    按上面的分析,主要要做三件事:一是单例的client,二是缓存的保活连接,三是更好的处理返回结果。一就不说了,来说说二。
    提到连接缓存,很容易联想到数据库连接池。httpclient4提供了一个PoolingHttpClientConnectionManager作为连接池。接下来通过以下步骤来优化:

    3.1 定义一个keep alive strategy

    关于keep-alive,这里不展开说明,只提一点,是否使用keep-alive要根据业务情况来定,它并不是灵丹妙药。还有一点,keep-alive和time_wait/close_wait之间也有不少故事。
    在本业务场景里,相当于有少数固定客户端,长时间极高频次的访问服务器,启用keep-alive非常合适
    再多提一嘴,http的keep-alive 和tcp的KEEPALIVE不是一个东西。回到正文,定义一个strategy如下:

    1. ConnectionKeepAliveStrategy myStrategy = new ConnectionKeepAliveStrategy() {
    2. @Override
    3. public long getKeepAliveDuration(HttpResponse response, HttpContext context) {
    4. HeaderElementIterator it = new BasicHeaderElementIterator
    5. (response.headerIterator(HTTP.CONN_KEEP_ALIVE));
    6. while (it.hasNext()) {
    7. HeaderElement he = it.nextElement();
    8. String param = he.getName();
    9. String value = he.getValue();
    10. if (value != null && param.equalsIgnoreCase
    11. ("timeout")) {
    12. return Long.parseLong(value) * 1000;
    13. }
    14. }
    15. return 60 * 1000;//如果没有约定,则默认定义时长为60s
    16. }
    17. };

    3.2 配置一个PoolingHttpClientConnectionManager

    1. PoolingHttpClientConnectionManager connectionManager = new PoolingHttpClientConnectionManager();
    2. connectionManager.setMaxTotal(500);
    3. connectionManager.setDefaultMaxPerRoute(50);//例如默认每路由最高50并发,具体依据业务来定

    也可以针对每个路由设置并发数。

    3.3 生成httpclient

    1. httpClient = HttpClients.custom()
    2. .setConnectionManager(connectionManager)
    3. .setKeepAliveStrategy(kaStrategy)
    4. .setDefaultRequestConfig(RequestConfig.custom().setStaleConnectionCheckEnabled(true).build())
    5. .build();

    注意:使用setStaleConnectionCheckEnabled方法来逐出已被关闭的链接不被推荐。更好的方式是手动启用一个线程,定时运行closeExpiredConnectionscloseIdleConnections方法,如下所示。 ```java public static class IdleConnectionMonitorThread extends Thread {

    private final HttpClientConnectionManager connMgr; private volatile boolean shutdown;

    public IdleConnectionMonitorThread(HttpClientConnectionManager connMgr) {

    1. super();
    2. this.connMgr = connMgr;

    }

    @Override public void run() {

    1. try {
    2. while (!shutdown) {
    3. synchronized (this) {
    4. wait(5000);
    5. // Close expired connections
    6. connMgr.closeExpiredConnections();
    7. // Optionally, close connections
    8. // that have been idle longer than 30 sec
    9. connMgr.closeIdleConnections(30, TimeUnit.SECONDS);
    10. }
    11. }
    12. } catch (InterruptedException ex) {
    13. // terminate
    14. }

    }

    public void shutdown() {

    1. shutdown = true;
    2. synchronized (this) {
    3. notifyAll();
    4. }

    }

}

  1. <a name="XfmKv"></a>
  2. ### 3.4 使用httpclient执行method时降低开销
  3. 这里要注意的是,不要关闭connection。<br />一种可行的获取内容的方式类似于,把entity里的东西复制一份:
  4. ```java
  5. res = EntityUtils.toString(response.getEntity(),"UTF-8");
  6. EntityUtils.consume(response1.getEntity());

但是,更推荐的方式是定义一个ResponseHandler,方便你我他,不再自己catch异常和关闭流。在此可以看一下相关的源码:

  1. public <T> T execute(final HttpHost target, final HttpRequest request,
  2. final ResponseHandler<? extends T> responseHandler, final HttpContext context)
  3. throws IOException, ClientProtocolException {
  4. Args.notNull(responseHandler, "Response handler");
  5. final HttpResponse response = execute(target, request, context);
  6. final T result;
  7. try {
  8. result = responseHandler.handleResponse(response);
  9. } catch (final Exception t) {
  10. final HttpEntity entity = response.getEntity();
  11. try {
  12. EntityUtils.consume(entity);
  13. } catch (final Exception t2) {
  14. // Log this exception. The original exception is more
  15. // important and will be thrown to the caller.
  16. this.log.warn("Error consuming content after an exception.", t2);
  17. }
  18. if (t instanceof RuntimeException) {
  19. throw (RuntimeException) t;
  20. }
  21. if (t instanceof IOException) {
  22. throw (IOException) t;
  23. }
  24. throw new UndeclaredThrowableException(t);
  25. }
  26. // Handling the response was successful. Ensure that the content has
  27. // been fully consumed.
  28. final HttpEntity entity = response.getEntity();
  29. EntityUtils.consume(entity);//看这里看这里
  30. return result;
  31. }

可以看到,如果使用resultHandler执行execute方法,会最终自动调用consume方法,而这个consume方法如下所示:

  1. public static void consume(final HttpEntity entity) throws IOException {
  2. if (entity == null) {
  3. return;
  4. }
  5. if (entity.isStreaming()) {
  6. final InputStream instream = entity.getContent();
  7. if (instream != null) {
  8. instream.close();
  9. }
  10. }
  11. }

可以看到最终它关闭了输入流。

4、其他

通过以上步骤,基本就完成了一个支持高并发的httpclient的写法,下面是一些额外的配置和提醒:

4.1 httpclient的一些超时配置

CONNECTION_TIMEOUT是连接超时时间,SO_TIMEOUT是socket超时时间,这两者是不同的。连接超时时间是发起请求前的等待时间;socket超时时间是等待数据的超时时间。

  1. HttpParams params = new BasicHttpParams();
  2. //设置连接超时时间
  3. Integer CONNECTION_TIMEOUT = 2 * 1000; //设置请求超时2秒钟 根据业务调整
  4. Integer SO_TIMEOUT = 2 * 1000; //设置等待数据超时时间2秒钟 根据业务调整
  5. //定义了当从ClientConnectionManager中检索ManagedClientConnection实例时使用的毫秒级的超时时间
  6. //这个参数期望得到一个java.lang.Long类型的值。如果这个参数没有被设置,默认等于CONNECTION_TIMEOUT,因此一定要设置。
  7. Long CONN_MANAGER_TIMEOUT = 500L; //在httpclient4.2.3中我记得它被改成了一个对象导致直接用long会报错,后来又改回来了
  8. params.setIntParameter(CoreConnectionPNames.CONNECTION_TIMEOUT, CONNECTION_TIMEOUT);
  9. params.setIntParameter(CoreConnectionPNames.SO_TIMEOUT, SO_TIMEOUT);
  10. params.setLongParameter(ClientPNames.CONN_MANAGER_TIMEOUT, CONN_MANAGER_TIMEOUT);
  11. //在提交请求之前 测试连接是否可用
  12. params.setBooleanParameter(CoreConnectionPNames.STALE_CONNECTION_CHECK, true);
  13. //另外设置http client的重试次数,默认是3次;当前是禁用掉(如果项目量不到,这个默认即可)
  14. httpClient.setHttpRequestRetryHandler(new DefaultHttpRequestRetryHandler(0, false));

4.2 如果配置了Nginx的话,Nginx也要设置面向两端的keep-alive

现在的业务里,没有Nginx的情况反而比较稀少。Nginx默认和client端打开长连接而和server端使用短链接。注意client端的keepalive_timeout和keepalive_requests参数,以及upstream端的keepalive参数设置,这三个参数的意义在此也不再赘述。
以上就是全部设置。通过这些设置,成功地将原本每次请求250ms的耗时降低到了80左右,效果显著。
JAR包如下:

  1. <!-- httpclient -->
  2. <dependency>
  3. <groupId>org.apache.httpcomponents</groupId>
  4. <artifactId>httpclient</artifactId>
  5. <version>4.5.6</version>
  6. </dependency>

代码如下:

  1. //Basic认证
  2. private static final CredentialsProvider credsProvider = new BasicCredentialsProvider();
  3. //httpClient
  4. private static final CloseableHttpClient httpclient;
  5. //httpGet方法
  6. private static final HttpGet httpget;
  7. //
  8. private static final RequestConfig reqestConfig;
  9. //响应处理器
  10. private static final ResponseHandler<String> responseHandler;
  11. //jackson解析工具
  12. private static final ObjectMapper mapper = new ObjectMapper();
  13. static {
  14. System.setProperty("http.maxConnections","50");
  15. System.setProperty("http.keepAlive", "true");
  16. //设置basic校验
  17. credsProvider.setCredentials(
  18. new AuthScope(AuthScope.ANY_HOST, AuthScope.ANY_PORT, AuthScope.ANY_REALM),
  19. new UsernamePasswordCredentials("", ""));
  20. //创建http客户端
  21. httpclient = HttpClients.custom()
  22. .useSystemProperties()
  23. .setRetryHandler(new DefaultHttpRequestRetryHandler(3,true))
  24. .setDefaultCredentialsProvider(credsProvider)
  25. .build();
  26. //初始化httpGet
  27. httpget = new HttpGet();
  28. //初始化HTTP请求配置
  29. reqestConfig = RequestConfig.custom()
  30. .setContentCompressionEnabled(true)
  31. .setSocketTimeout(100)
  32. .setAuthenticationEnabled(true)
  33. .setConnectionRequestTimeout(100)
  34. .setConnectTimeout(100).build();
  35. httpget.setConfig(reqestConfig);
  36. //初始化response解析器
  37. responseHandler = new BasicResponseHandler();
  38. }
  39. /*
  40. * 功能:返回响应
  41. * @date 2019/1/3 上午11:19
  42. * @param [url]
  43. * @return org.apache.http.client.methods.CloseableHttpResponse
  44. * @exception
  45. */
  46. public static String getResponse(String url) throws IOException {
  47. HttpGet get = new HttpGet(url);
  48. String response = httpclient.execute(get,responseHandler);
  49. return response;
  50. }
  51. /*
  52. * 功能:发送http请求,并用net.sf.json工具解析
  53. * @date 2018/8/15 下午2:21
  54. * @param [url]
  55. * @return org.json.JSONObject
  56. * @exception
  57. */
  58. public static JSONObject getUrl(String url) throws Exception{
  59. try {
  60. httpget.setURI(URI.create(url));
  61. String response = httpclient.execute(httpget,responseHandler);
  62. JSONObject json = JSONObject.fromObject(response);
  63. return json;
  64. } catch (IOException e) {
  65. e.printStackTrace();
  66. }
  67. return null;
  68. }
  69. /*
  70. * 功能:发送http请求,并用jackson工具解析
  71. * @date 2018/12/24 下午2:58
  72. * @param [url]
  73. * @return com.fasterxml.jackson.databind.JsonNode
  74. * @exception
  75. */
  76. public static JsonNode getUrl2(String url){
  77. try {
  78. httpget.setURI(URI.create(url));
  79. String response = httpclient.execute(httpget,responseHandler);
  80. JsonNode node = mapper.readTree(response);
  81. return node;
  82. } catch (IOException e) {
  83. e.printStackTrace();
  84. }
  85. return null;
  86. }
  87. /*
  88. * 功能:发送http请求,并用fastjson工具解析
  89. * @date 2018/12/24 下午2:58
  90. * @param [url]
  91. * @return com.fasterxml.jackson.databind.JsonNode
  92. * @exception
  93. */
  94. public static com.alibaba.fastjson.JSONObject getUrl3(String url){
  95. try {
  96. httpget.setURI(URI.create(url));
  97. String response = httpclient.execute(httpget,responseHandler);
  98. com.alibaba.fastjson.JSONObject jsonObject = com.alibaba.fastjson.JSONObject.parseObject(response);
  99. return jsonObject;
  100. } catch (IOException e) {
  101. e.printStackTrace();
  102. }
  103. return null;
  104. }