一、背景说明
1-生产环境中的问题
- 生产环境发生了内存溢出该如何处理?
- 生产环境应该给服务器分配多少内存合适?
- 如何对垃圾回收器的性能进行调优?
- 生产环境CPU负载飙高该如何处理?
- 生产环境应该给应用分配多少线程合适?
- 不加log,如何确定请求是否执行了某一行代码?
-
2-调优基本问题
1-为什么要调优?
防止出现OOM,进行JVM规划和预调优
- 解决程序运行中各种OOM
减少Full GC出现的频率,解决运行慢、卡顿问题
合理地编写代码
- 合理分配对象的生命周期,尽量避免生命周期过长的对象占据内存空间
- 充分并合理的使用硬件资源
-
3-不同阶段的考虑
上线前
- 项目运行阶段
-
4-两句话
调优,从业务场景开始,没有业务场景的调优都是耍流氓!
-
二、调优概述
1-调优监控的依据
运行日志
- 异常堆栈
- GC日志
- 线程快照
-
2-调优的大方向
合理地编写代码
- 充分并合理的使用硬件资源
-
三、性能优化的步骤
第1步(发现问题):性能监控
GC 频繁
- cpu load过高
- OOM
- 内存泄漏
- 死锁,死锁会导致cpu占用过高
-
第2步(排查问题):性能分析
打印GC日志,通过GCviewer或者 http://gceasy.io来分析日志信息
- 灵活运用 命令行工具,jstack,jmap,jinfo等
- dump出堆文件,使用内存分析工具分析文件
- 使用阿里Arthas,或jconsole,JVisualVM来实时查看JVM状态
-
第3步(解决问题):性能调优
适当增加内存,根据业务背景选择垃圾回收器
- 优化代码,控制内存使用
- 增加机器,分散节点压力
- 合理设置线程池线程数量
- 使用中间件提高程序效率,比如缓存,消息队列等
-
四、性能评价/测试指标
1-停顿时间(或响应时间)
2-吞吐量
对单位时间内完成的工作量(请求)的量度
- 在GC中:运行用户代码的事件占总运行时间的比例(总运行时间:程序的运行时间+内存回收的时间)吞吐量为1-1/(1+n),其中-XX::GCTimeRatio=n
3-并发数
同一时刻,对服务器有实际交互的请求数4-内存占用
Java堆区所占的内存大小5-相互间的关系
以高速公路通行状况为例