日志
日常工作中,程序员需要经常处理线上的各种大小故障,如果业务代码没打印日志或者日志打印的不好,会极大的加大了定位问题的难度,使得解决bug的时间变长了。对于那种影响比较大的bug,处理时间是分秒必争的,慢几秒处理完,可能GMV就哗啦啦的掉了很多。

请统一日志格式

日志格式最好是统一的,即方便查看定位问题又方便统计收集。一般定义一个LogObject对象,里面定义日志的各个字段。例如:

  1. import com.fasterxml.jackson.annotation.JsonInclude;
  2. import com.fasterxml.jackson.annotation.JsonInclude.Include;
  3. import com.fasterxml.jackson.annotation.JsonProperty;
  4. public class LogObject {
  5. @JsonProperty(index = 1)
  6. private String eventName;
  7. @JsonProperty(index = 2)
  8. private String traceId;
  9. @JsonProperty(index = 3)
  10. private String msg;
  11. @JsonProperty(index = 4)
  12. private long costTime;
  13. @JsonProperty(index = 6)
  14. private Integer userId;
  15. @JsonProperty(index = 7)
  16. private Object others;
  17. @JsonProperty(index = 8)
  18. private Object request;
  19. @JsonProperty(index = 9)
  20. private Object response;
  21. public String getEventName() {
  22. return eventName;
  23. }
  24. public LogObject setEventName(String eventName) {
  25. this.eventName = eventName;
  26. return this;
  27. }
  28. public Object getRequest() {
  29. return request;
  30. }
  31. public LogObject setRequest(Object request) {
  32. this.request = request;
  33. return this;
  34. }
  35. public Object getResponse() {
  36. return response;
  37. }
  38. public LogObject setResponse(Object response) {
  39. this.response = response;
  40. return this;
  41. }
  42. public String getMsg() {
  43. return msg;
  44. }
  45. public LogObject setMsg(String msg) {
  46. this.msg = msg;
  47. return this;
  48. }
  49. public long getCostTime() {
  50. return costTime;
  51. }
  52. public LogObject setCostTime(long costTime) {
  53. this.costTime = costTime;
  54. return this;
  55. }
  56. public Integer getUserId() {
  57. return userId;
  58. }
  59. public LogObject setUserId(Integer userId) {
  60. this.userId = userId;
  61. return this;
  62. }
  63. public Object getOthers() {
  64. return others;
  65. }
  66. public LogObject setOthers(Object others) {
  67. this.others = others;
  68. return this;
  69. }
  70. public String getTraceId() {
  71. return traceId;
  72. }
  73. public LogObject setTraceId(String traceId) {
  74. this.traceId = traceId;
  75. return this;
  76. }
  77. }
  • traceId: 调用链id
  • eventName: 事件名称,一般就是业务方法名称
  • userId: C端用户id
  • msg: 结果消息
  • costTime: 接口响应时间
  • request: 接口请求入参
  • response: 接口返回值
  • others: 其他业务参数

使用链式的风格,方便设置字段的值:

  1. long endTime = System.currentTimeMillis();
  2. LogObject logObject = new LogObject();
  3. logObject.setEventName(methodName)
  4. .setMsg(msg)
  5. .setTraceId(traceId)
  6. .setUserId(backendId)
  7. .setRequest(liveRoomPushOrderReqDto)
  8. .setResponse(response)
  9. .setCostTime((endTime - beginTime));
  10. LOGGER.info(JSON.toJSONString(logObject));

当然最好还是封装出一个工具类出来,例如叫:LogTemplate,作为一个统一的入口。另外可以使用JsonProperty注解,指定字段的顺序,例如通过index=1,将eventName放置在最前面。

  1. @JsonProperty(index = 1)
  2. private String eventName;

将request和response放置在一起

将请求和返回值,放置在同一条日志里,有个好处,就是非常方便查看上下文日志。如果打印成两条,返回值那条可能被冲到很后面,而且也得再做一次grep操作,影响效率。

  1. {
  2. "eventName": "createOrder",
  3. "traceId": "createOrder_1574923602015",
  4. "msg": "success",
  5. "costTime": 317,
  6. "request": {
  7. "uId": 111111111,
  8. "skuList": [
  9. {
  10. "skuId": 22222222,
  11. "buyNum": 1,
  12. "buyPrice": 8800
  13. }
  14. ]
  15. },
  16. "response": {
  17. "code": 0,
  18. "message": "操作成功",
  19. "data": {
  20. "bigOrderId": "BIG2019",
  21. "m2LOrderIds": {
  22. "MID2019": {
  23. "22222222": "LIT2019"
  24. }
  25. }
  26. }
  27. }
  28. }

为了能拼成一条,有两种方案,一种是比较low的,直接在代码里使用try catch finally,例如:

  1. @PostMapping(value = "/createOrder")
  2. public JsonResult createOrder(@RequestBody Object request) throws Exception {
  3. String methodName = "/createOrder";
  4. Integer backendId = null;
  5. String msg = "success";
  6. long beginTime = System.currentTimeMillis();
  7. String traceId = "createOrder_"+beginTime;
  8. JsonResult response = null;
  9. try {
  10. OrderCreateRsp orderCreateRsp = orderOperateService.createOrder(request, traceId);
  11. response = JsonResult.success(orderCreateRsp);
  12. }
  13. catch (Exception e) {
  14. msg = e.getMessage();
  15. LOGGER.error(methodName+",userId:"+backendId+",request:"+ JsonHelper.toJson(request),e);
  16. throw new BizException(0,"下单失败");
  17. }
  18. finally {
  19. long endTime = System.currentTimeMillis();
  20. LogObject logObject = new LogObject();
  21. logObject.setEventName(methodName)
  22. .setMsg(msg)
  23. .setTraceId(traceId)
  24. .setUserId(backendId)
  25. .setRequest(request)
  26. .setResponse(response)
  27. .setCostTime((endTime - beginTime));
  28. LOGGER.info(JSON.toJSONString(logObject));
  29. }
  30. return response;
  31. }

这种方案呢,有个缺点,就是每个业务方法都得处理日志,更好的方案是使用aop加thread local的方式,将请求统一拦截且将返回值和请求参数串起来,这个网络上的方案很多,这里就不阐述了。
对于对性能要求比较高的应用,反而推荐第一种方案,因为使用aop,有一些性能损耗。

日志里加入traceId

如果应用中已经使用了统一调用链监控方案,且能根据调用链id查询接口情况的,可以不用在代码里手动加入traceId。如果应用还没接入调用链系统,建议加一下traceId,尤其是针对聚合服务,需要调用中台各种微服务接口的。像聚合层下单业务,需要调用的微服务就有如下这么些:

  • 营销系统
  • 订单系统
  • 支付系统

下单业务调用这些接口的时候,如果没有使用traceId进行跟踪的话,当下单失败的时候,到底是哪个微服务接口失败了,就比较难找。下面以小程序端,调用聚合层下单接口的例子作为展示:

  1. //营销系统
  2. {
  3. "eventName": "pms/getInfo",
  4. "traceId": "createOrder_1575270928956",
  5. "msg": "success",
  6. "costTime": 2,
  7. "userId": 1111111111,
  8. "request": {
  9. "userId": 1111111111,
  10. "skuList": [
  11. {
  12. "skuId": 2222,
  13. "skuPrice": 65900,
  14. "buyNum": 1,
  15. "activityType": 0,
  16. "activityId": 0
  17. }
  18. ]
  19. },
  20. "response": {
  21. "result": 1,
  22. "msg": "success",
  23. "data": {
  24. "realPayFee": 100
  25. }
  26. }
  27. }
  28. //订单系统
  29. {
  30. "eventName": "orderservice/createOrder",
  31. "traceId": "createOrder_1575270928956",
  32. "msg": "success",
  33. "costTime": 29,
  34. "userId": null,
  35. "request": {
  36. "skuList": [
  37. {
  38. "skuId": 2222,
  39. "buyNum": 1,
  40. "buyPrice": 65900
  41. }
  42. ]
  43. },
  44. "response": {
  45. "result": "200",
  46. "msg": "调用成功",
  47. "data": {
  48. "bigOrderId": "BIG2019",
  49. "m2LOrderIds": {
  50. "MID2019": {
  51. "88258135": "LIT2019"
  52. }
  53. }
  54. }
  55. }
  56. }
  57. //支付系统
  58. {
  59. "eventName": "payservice/pay",
  60. "traceId": "createOrder_1575270928956",
  61. "msg": "success",
  62. "costTime": 301,
  63. "request": {
  64. "orderId": "BIG2019",
  65. "paySubject": "测试",
  66. "totalFee": 65900
  67. },
  68. "response": {
  69. "requestId": "test",
  70. "code": 0,
  71. "message": "操作成功",
  72. "data": {
  73. "payId": 123,
  74. "orderId": "BIG2019",
  75. "tradeType": "JSAPI",
  76. "perpayId": "test",
  77. "nonceStr": "test",
  78. "appId": "test",
  79. "signType": "MD5",
  80. "sign": "test",
  81. "timeStamp": "1575270929"
  82. }
  83. }
  84. }

可以看到聚合层需要调用营销、订单和支付三个应用的接口,调用的过程中,使用traceId为createOrder_1575270928956的串了起来,这样只需要grep这个traceId就可以把所有相关的调用和上下文找出来。
traceId如何生成呢,一种简单的做法是,使用System.currentTimeMillis() 加上业务接口名字,如:

  1. long beginTime = System.currentTimeMillis();
  2. String traceId = "createOrder_"+beginTime;

加traceId会侵入到业务方法里,比如说:

  1. public void createOrder(Object obj) {
  2. long beginTime = System.currentTimeMillis();
  3. String traceId = "createOrder_"+beginTime;
  4. pmsService.getInfo(obj,traceId);
  5. orderService.createOrder(obj,traceId);
  6. payService.getPrepayId(obj,traceId);
  7. }

pmsService这些内部的service方法,都需要加一个traceId字段,目前觉得还好,要是觉得入侵了,也可以考虑thread local的方式,处理请求的时候,为当前线程存储一下traceId,然后在业务方法里,再从当前线程里拿出来,避免接口方法里的traceId满天飞。