2021.12.16

从昨天一直搞的环境部署问题,其实一开始就是自己的问题导致的,还以为是master代码merge过来有问题。这体现出了自己的问题排查能力不足。

总体来看遇到两个问题

  • 一个是部署的时候报错。一开始怀疑是不是自己想用service注解加了starter导致的(工程里都是采用xml定义bean,太繁琐,想改用注解方式定义),回滚代码后还是报错,但其实这个时候已经是新的报错,没仔细看报错。又开始以为是机器环境问题,开始切机器,机器自己部署又遇到oom,解了好久没解决,放弃。又想想merge master最新代码试试,是不是不是最新代码导致的。

image.png

  • 然后merge 的时候,又遇到昨天碰到的部分类merge不过来的问题。排查了很久,应该是本地的分支太老了,直接应该merge过一次存在脏代码。各种尝试不行。最后只能新建一个分支,把自己dps的代码copy过去
  • 其他细问题:打印日志的异常导致启动失败的情况,每次改动启动部署又要比较久

最后问题解决完耗时竟有一天的时间。

暴露出的问题

  • 没有耐心仔细看看报错。
  • 对问题排查没有太多经验,猜疑机器环境问题,猜疑自己代码问题,遇到的OOM问题也不能快速解决

经验:

先不要怀疑别人,先找自己的问题,从日志应该很明显能看出来,如果一开始就看出来,就少了很多过程。