JVM调优的liunx命令

来源:互联网 发布:淘宝不实名能买东西吗 编辑:程序博客网 时间:2024/05/23 02:01

在平时的运维工作中,我们经常会碰到下面这些问题:

1、OutOfMemoryError,内存不足
2、内存泄露
3、线程死锁
4、锁争用(Lock Contention)
5、Java进程消耗CPU过高

导致服务器CPU或者内存飙高影响线上业务,对于解决以上问题,我们常用的JVM性能调优监控工具有:jps、jstat、jstack、jmap、jhat、hprof、jinfo

如果想要查看Java进程中线程堆栈的信息,可以选择jstack,如果要查看堆内存,可以使用jmap导出并使用jhat来进行分析,包括查看类的加载信息,GC算法那,对象的使用情况等,还可以使用jstat来对JVM进行统计监测,包括查看各个区内存和GC的情况,还可以使用hprof能够展现CPU使用率,统计堆内存使用情况。

1、jps命令:

作用:

主要用来输出JVM中运行的进程状态信息。语法格式如下:

语法格式:

jps [options] [hostid] 如果不指定hostid就默认为当前主机或服务器。

命令参数:

-q 不输出类名、Jar名和传入main方法的参数-m 输出传入main方法的参数-l 输出main类或Jar的全限名-v 输出传入JVM的参数
[root@web02 ~]# jps -lmPicked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcd9346 org.apache.catalina.startup.Bootstrap start19301 GpsTracker4.jar12520 org.apache.catalina.startup.Bootstrap start25402 GPSTracker1.jar18463 GPSTracker5.jar7940 org.apache.catalina.startup.Bootstrap start12452 org.apache.catalina.startup.Bootstrap start8865 org.apache.catalina.startup.Bootstrap start5489 org.apache.catalina.startup.Bootstrap start1568 org.apache.catalina.startup.Bootstrap start32543 GPSTracker2.jar25441 org.apache.catalina.startup.Bootstrap start574 org.apache.catalina.startup.Bootstrap start14498 org.apache.catalina.startup.Bootstrap start25453 ./DEyesPushServer.jar2723 org.apache.catalina.startup.Bootstrap start10584 bdwiseGpsTrack.jar2031 org.apache.catalina.startup.Bootstrap start

加入参数-V后,会把jvm的启动参数全部输出:

[root@web02 ~]# jps -lmvPicked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcd9346 org.apache.catalina.startup.Bootstrap start -Djava.util.logging.config.file=/home/tomcat/tomcat6/9704_event/conf/logging.properties -Djava.util.logging.manager=org.apache.juli.ClassLoaderLogManager -Xms256m -Xmx3072m -XX:PermSize=256M -XX:MaxPermSize=768M -Djava.endorsed.dirs=/home/tomcat/tomcat6/9704_event/endorsed -Dcatalina.base=/home/tomcat/tomcat6/9704_event -Dcatalina.home=/home/tomcat/tomcat6/9704_event -Djava.io.tmpdir=/home/tomcat/tomcat6/9704_event/temp -Dawt.useSystemAAFontSettings=lcd19301 GpsTracker4.jar -Dawt.useSystemAAFontSettings=lcd12520 org.apache.catalina.startup.Bootstrap start -Djava.util.logging.config.file=/home/tomcat/tomcat_gps_prod/9301_gpstrack/conf/logging.properties -Djava.util.logging.manager=org.apache.juli.ClassLoaderLogManager -Xms256m -Xmx3072m -XX:PermSize=256M -XX:MaxPermSize=768M -Djava.endorsed.dirs=/home/tomcat/tomcat_gps_prod/9301_gpstrack/endorsed -Dcatalina.base=/home/tomcat/tomcat_gps_prod/9301_gpstrack -Dcatalina.home=/home/tomcat/tomcat_gps_prod/9301_gpstrack -Djava.io.tmpdir=/home/tomcat/tomcat_gps_prod/9301_gpstrack/temp -Dawt.useSystemAAFontSettings=lcd25402 GPSTracker1.jar -Dawt.useSystemAAFontSettings=lcd18463 GPSTracker5.jar -Dawt.useSystemAAFontSettings=lcd

2.jstat命令

作用:

用于监视虚拟机运行时状态信息的命令,它可以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据

语法格式:

jstat [option] LVMID [interval] [count]

参数含义:

[option] : 操作参数LVMID   : Java虚拟机ID,在Linux/Unix系统上一般就是进程ID[interval] : 是采样时间间隔[count] : count是采样数目

option参数总览:
这里写图片描述

option 参数详解

-class:监视类装载、卸载数量、总空间以及耗费的时间

[root@web02 ~]# jstat -class 9346Picked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcdLoaded  Bytes  Unloaded  Bytes     Time    31909 64439.1      998  2028.2      22.75[root@web02 ~]# jstat -class 12520Picked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcdLoaded  Bytes  Unloaded  Bytes     Time     7696 15390.2        0     0.0       8.84[root@web02 ~]# jstat -class 7940Picked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcdLoaded  Bytes  Unloaded  Bytes     Time    27776 54941.7      136   292.5      27.44
Loaded : 加载class的数量Bytes : class字节大小Unloaded : 未加载class的数量Bytes : 未加载class的字节大小Time : 加载时间

-compiler:输出JIT编译过的方法数量耗时等

[root@web02 ~]# jstat -compiler 9346Picked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcdCompiled Failed Invalid   Time   FailedType FailedMethod    6262      5       0   137.64          1 org/springframework/context/annotation/CommonAnnotationBeanPostProcessor buildResourceMetadata[root@web02 ~]# jstat -compiler 12520Picked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcdCompiled Failed Invalid   Time   FailedType FailedMethod    1013      3       0    18.29          1 org/apache/catalina/loader/WebappClassLoader findResourceInternal[root@web02 ~]# jstat -compiler 7940Picked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcdCompiled Failed Invalid   Time   FailedType FailedMethod    4163      2       0    84.02          1 org/apache/catalina/loader/WebappClassLoader findResourceInternal[root@web02 ~]# ps -ef | grep 7940root      5665  4118  0 17:29 pts/11   00:00:00 grep 7940

Compiled : 编译数量
Failed : 编译失败数量
Invalid : 无效数量
Time : 编译耗时
FailedType : 失败类型
FailedMethod : 失败方法的全限定名
-gc:垃圾回收堆的行为统计,常用命令

[root@web02 ~]# jstat -gc 9346Picked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcd S0C    S1C    S0U    S1U      EC       EU        OC         OU       PC     PU    YGC     YGCT    FGC    FGCT     GCT   20992.0 32256.0 4952.4  0.0   227840.0 147675.8  222720.0   167726.6  262144.0 188115.3     46    1.324   5      2.933    4.256

比如下面输出的是GC信息,采样时间间隔为250ms,采样数为4:

[root@web02 ~]# jstat -gc 9346 250 4Picked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcd S0C    S1C    S0U    S1U      EC       EU        OC         OU       PC     PU    YGC     YGCT    FGC    FGCT     GCT   20992.0 32256.0 4952.4  0.0   227840.0 147678.0  222720.0   167726.6  262144.0 188118.3     46    1.324   5      2.933    4.25620992.0 32256.0 4952.4  0.0   227840.0 147678.0  222720.0   167726.6  262144.0 188118.3     46    1.324   5      2.933    4.25620992.0 32256.0 4952.4  0.0   227840.0 147678.0  222720.0   167726.6  262144.0 188118.3     46    1.324   5      2.933    4.25620992.0 32256.0 4952.4  0.0   227840.0 147678.0  222720.0   167726.6  262144.0 188118.3     46    1.324   5      2.933    4.256

要明白上面各列的意义,先看JVM堆内存布局:
这里写图片描述

可以看出:

堆内存 = 年轻代 + 年老代 + 永久代
年轻代 = Eden区 + 两个Survivor区(From和To)

现在来解释各列含义:

C即Capacity 总容量,U即Used 已使用的容量

S0C : survivor0区的总容量
S1C : survivor1区的总容量
S0U : survivor0区已使用的容量
S1C : survivor1区已使用的容量
EC : Eden区的总容量
EU : Eden区已使用的容量
OC : Old区的总容量
OU : Old区已使用的容量
PC 当前perm的容量 (KB)
PU perm的使用 (KB)
YGC : 新生代垃圾回收次数
YGCT : 新生代垃圾回收时间
FGC : 老年代垃圾回收次数
FGCT : 老年代垃圾回收时间
GCT : GC垃圾回收总消耗时间

-gcutil:同-gc,不过输出的是已使用空间占总空间的百分比

[root@web02 etc]# jstat -gcutil 29544  S0     S1     E      O      P     YGC     YGCT    FGC    FGCT     GCT    62.67   0.00  65.20  16.10  99.85     34    1.235     0    0.000    1.235

-gccause:垃圾收集统计概述(同-gcutil),附加最近两次垃圾回收事件的原因

[root@web02 etc]# jstat -gccause 29544  S0     S1     E      O      P     YGC     YGCT    FGC    FGCT     GCT    LGCC                 GCC                  62.67   0.00  65.20  16.10  99.85     34    1.235     0    0.000    1.235 Allocation Failure   No GC 

LGCC:最近垃圾回收的原因
GCC:当前垃圾回收的原因
-gcnew:统计新生代的行为

[root@web02 etc]# jstat -gcnew 29544 S0C    S1C    S0U    S1U   TT MTT  DSS      EC       EU     YGC     YGCT  34944.0 34944.0 21900.2    0.0 16  31 17472.0 279616.0 182323.5     34    1.235

TT:Tenuring threshold(提升阈值)
MTT:最大的tenuring threshold
DSS:survivor区域大小 (KB)
-gcnewcapacity:新生代与其相应的内存空间的统计

Picked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcd  NGCMN      NGCMX       NGC      S0CMX     S0C     S1CMX     S1C       ECMX        EC      YGC   FGC   349504.0   349504.0   349504.0  34944.0  34944.0  34944.0  34944.0   279616.0   279616.0    34     0

NGC:当前年轻代的容量 (KB)
S0CMX:最大的S0空间 (KB)
S0C:当前S0空间 (KB)
ECMX:最大eden空间 (KB)
EC:当前eden空间 (KB)

-gcold:统计旧生代的行为

[root@web02 etc]# jstat -gclod 29544   PC       PU        OC          OU       YGC    FGC    FGCT     GCT   164480.0 164236.6    699072.0    112581.0     34     0    0.000    1.235

-gcoldcapacity:统计旧生代的大小和空间

[root@web02 etc]# jstat -gcoldcapacity 29544   OGCMN       OGCMX        OGC         OC       YGC   FGC    FGCT     GCT      699072.0    699072.0    699072.0    699072.0    34     0    0.000    1.235

-gcpermcapacity:永生代行为统计

[root@web02 etc]# jstat -gcpermcapacity 29544  PGCMN      PGCMX       PGC         PC      YGC   FGC    FGCT     GCT     131072.0   262144.0   164480.0   164480.0    34     0    0.000    1.235

-printcompilation:hotspot编译方法统计

[root@web02 etc]# jstat -printcompilation 29544Compiled  Size  Type Method    2957   1032    1 org/apache/jasper/compiler/SmapUtil$SDEInstaller copyConstantPool

Compiled:被执行的编译任务的数量
Size:方法字节码的字节数
Type:编译类型
Method:编译方法的类名和方法名。类名使用”/” 代替 “.” 作为空间分隔符. 方法名是给出类的方法名. 格式是一致于HotSpot – XX:+PrintComplation 选项

jmap命令:
作用:

jmap(JVM Memory Map)命令用来查看堆内存使用状况,一般结合jhat使用,用于生成heap dump文件,如果不使用这个命令,还可以使用-XX:+HeapDumpOnOutOfMemoryError参数来让虚拟机出现OOM的时候·自动生成dump文件。jmap不仅能生成dump文件,还可以查询finalize执行队列、Java堆和永久代的详细信息,如当前使用率、当前使用的是哪种收集器等。

命令格式:

jmap [option] LVMID

option参数:

dump : 导出内存转储快照
finalizerinfo : 显示在F-Queue队列等待Finalizer线程执行finalizer方法的对象
heap : 显示Java堆详细信息
histo : 显示堆中对象的统计信息
permstat : to print permanent generation statistics
F : 当-dump没有响应时,强制生成dump快照

-permstat:打印进程的类加载器和类加载器加载的持久代对象信息,输出:类加载器名称、对象是否存活(不可靠)、对象地址、父类加载器、已加载的类大小等信息

$ jmap -permstat 28920  Attaching to process ID 28920, please wait...  Debugger attached successfully.  Server compiler detected.  JVM version is 24.71-b01  finding class loader instances ..done.  computing per loader stat ..done.  please wait.. computing liveness.liveness analysis may be inaccurate ...  class_loader            classes bytes   parent_loader           alive?  type    <bootstrap>             3111    18154296          null          live    <internal>  0x0000000600905cf8      1       1888    0x0000000600087f08      dead    sun/reflect/DelegatingClassLoader@0x00000007800500a0  0x00000006008fcb48      1       1888    0x0000000600087f08      dead    sun/reflect/DelegatingClassLoader@0x00000007800500a0  0x00000006016db798      0       0       0x00000006008d3fc0      dead    java/util/ResourceBundle$RBClassLoader@0x0000000780626ec0  0x00000006008d6810      1       3056      null          dead    sun/reflect/DelegatingClassLoader@0x00000007800500a0

-heap:查看进程堆内存使用情况,包括使用的GC算法、堆配置参数和各代中堆内存使用情况,可以用此来判断内存目前的使用情况以及垃圾回收情况

[root@web02 etc]# jmap -heap 29544Attaching to process ID 29544, please wait...Debugger attached successfully.Server compiler detected.JVM version is 24.71-b01using parallel threads in the new generation.using thread-local object allocation.Concurrent Mark-Sweep GCHeap Configuration:   MinHeapFreeRatio = 40   MaxHeapFreeRatio = 70   MaxHeapSize      = 1073741824 (1024.0MB)   NewSize          = 357892096 (341.3125MB)   MaxNewSize       = 357892096 (341.3125MB)   OldSize          = 715784192 (682.625MB)   NewRatio         = 2   SurvivorRatio    = 8   PermSize         = 134217728 (128.0MB)   MaxPermSize      = 268435456 (256.0MB)   G1HeapRegionSize = 0 (0.0MB)Heap Usage:New Generation (Eden + 1 Survivor Space):   capacity = 322109440 (307.1875MB)   used     = 231861032 (221.11991119384766MB)   free     = 90248408 (86.06758880615234MB)   71.98206671620676% usedEden Space:   capacity = 286326784 (273.0625MB)   used     = 209435192 (199.73296356201172MB)   free     = 76891592 (73.32953643798828MB)   73.14551194763533% usedFrom Space:   capacity = 35782656 (34.125MB)   used     = 22425840 (21.386947631835938MB)   free     = 13356816 (12.738052368164062MB)   62.672374012706044% usedTo Space:   capacity = 35782656 (34.125MB)   used     = 0 (0.0MB)   free     = 35782656 (34.125MB)   0.0% usedconcurrent mark-sweep generation:   capacity = 715849728 (682.6875MB)   used     = 115282968 (109.9424057006836MB)   free     = 600566760 (572.7450942993164MB)   16.104353119206607% usedPerm Generation:   capacity = 168427520 (160.625MB)   used     = 168178312 (160.38733673095703MB)   free     = 249208 (0.23766326904296875MB)   99.85203843172422% used52703 interned Strings occupying 5899960 bytes.

可以很清楚的看到Java堆中各个区域目前的情况。

-histo:打印堆的对象统计,包括对象数、内存大小等等 (因为在dump:live前会进行full gc,如果带上live则只统计活对象,因此不加live的堆大小要大于加live堆的大小 )

root@web02 etc]# jmap -histo:live 29544 | morePicked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcd num     #instances         #bytes  class name----------------------------------------------   1:        294647       42231088  <constMethodKlass>   2:        294647       37726512  <methodKlass>   3:         30310       32955000  <constantPoolKlass>   4:         92965       27338592  [B   5:        254526       26667336  [C   6:         30310       21857304  <instanceKlassKlass>   7:         24015       17222656  <constantPoolCacheKlass>   8:         89222        6150624  [Ljava.lang.Object;   9:        250330        6007920  java.lang.String  10:         50382        4030560  java.lang.reflect.Method  11:         44966        3683408  [Ljava.util.HashMap$Entry;  12:         82747        3309880  java.util.LinkedHashMap$Entry  13:          5129        3286856  <methodDataKlass>  14:         99275        3176800  java.util.concurrent.ConcurrentHashMap$HashEntry  15:         98922        3165504  java.util.HashMap$Entry  16:         31965        3020128  java.lang.Class  17:         47367        2341800  [[I  18:         40473        2188416  [S  19:         25680        1438080  java.util.LinkedHashMap  20:         23419        1234360  [Ljava.lang.String;  21:          7983        1145488  [I  22:         44966        1079184  java.util.HashMap$FrontCache  23:          8249        1064896  [Ljava.util.concurrent.ConcurrentHashMap$HashEntry;  24:         21452        1029696  org.apache.catalina.loader.ResourceEntry  25:         23879         955160  java.lang.ref.SoftReference  26:         29514         944448  java.lang.ref.WeakReference  27:         38989         935736  java.util.ArrayList

xml class name是对象类型,说明如下:

B byteC charD doubleF floatI intJ longZ boolean[ 数组,如[I表示int[][L+类名 其他对象

-dump:导出内存转储快照

常用格式:

-dump::live,format=b,file= pid
dump:堆到文件
format:指定输出格式
live:指明是活着的对象
file:指定文件名

dump.hprof这个后缀是为了后续可以直接用MAT(Memory Anlysis Tool)打开。

-finalizerinfo:打印等待回收对象的信息

[root@web02 home]# jmap -finalizerinfo 29544Picked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcdAttaching to process ID 29544, please wait...Debugger attached successfully.Server compiler detected.JVM version is 24.71-b01Number of objects pending for finalization: 0

可以看到当前F-QUEUE队列中并没有等待Finalizer线程执行finalizer方法的对象。

-F:强制模式。如果指定的pid没有响应,请使用jmap -dump或jmap -histo选项。此模式下,不支持live子选项。

jhat命令:

作用:

jhat(JVM Heap Analysis Tool)命令是与jmap搭配使用,用来分析jmap生成的dump,jhat内置了一个微型的HTTP/HTML服务器,生成dump的分析结果后,可以在浏览器中查看。在此要注意,一般不会直接在服务器上进行分析,因为jhat是一个耗时并且耗费硬件资源的过程,一般把服务器生成的dump文件复制到本地或其他机器上进行分析。

命令格式:

jhat [dumpfile]

命令参数:

-stack false|true 

关闭对象分配调用栈跟踪(tracking object allocation call stack)。 如果分配位置信息在堆转储中不可用. 则必须将此标志设置为 false. 默认值为 true.

-refs false|true

关闭对象引用跟踪(tracking of references to objects)。 默认值为 true. 默认情况下, 返回的指针是指向其他特定对象的对象,如反向链接或输入引用(referrers or incoming references), 会统计/计算堆中的所有对象。

-port port-number

设置 jhat HTTP server 的端口号. 默认值 7000.
-exclude exclude-file

指定对象查询时需要排除的数据成员列表文件(a file that lists data members that should be excluded from the reachable objects query)。 例如, 如果文件列列出了 java.lang.String.value , 那么当从某个特定对象 Object o 计算可达的对象列表时, 引用路径涉及 java.lang.String.value 的都会被排除。

-baseline exclude-file

指定一个基准堆转储(baseline heap dump)。 在两个 heap dumps 中有相同 object ID 的对象会被标记为不是新的(marked as not being new). 其他对象被标记为新的(new). 在比较两个不同的堆转储时很有用.

-debug int

设置 debug 级别. 0 表示不输出调试信息。 值越大则表示输出更详细的 debug 信息.

-version

启动后只显示版本信息就退出
-J< flag >

因为 jhat 命令实际上会启动一个JVM来执行, 通过 -J 可以在启动JVM时传入一些启动参数. 例如, -J-Xmx512m 则指定运行 jhat 的Java虚拟机使用的最大堆内存为 512 MB. 如果需要使用多个JVM启动参数,则传入多个 -Jxxxxxx.

示例:

$ jhat -J-Xmx512m dump.hprof  eading from dump.hprof...  Dump file created Fri Mar 11 17:13:42 CST 2016  Snapshot read, resolving...  Resolving 271678 objects...  Chasing references, expect 54 dots......................................................  Eliminating duplicate references......................................................  Snapshot resolved.  Started HTTP server on port 7000  Server is ready.

中间的-J-Xmx512m是在dump快照很大的情况下分配512M内存去启动HTTP服务器,运行完之后就可在浏览器打开Http://localhost:7000进行快照分析 堆快照分析主要在最后面的Heap Histogram里,里面根据class列出了dump的时候所有存活对象。

分析同样一个dump快照,MAT需要的额外内存比jhat要小的多的多,所以建议使用MAT来进行分析,当然也看个人偏好。
分析

打开浏览器Http://localhost:7000,该页面提供了几个查询功能可供使用:

All classes including platformShow all members of the rootsetShow instance counts for all classes (including platform)Show instance counts for all classes (excluding platform)Show heap histogramShow finalizer summaryExecute Object Query Language (OQL) query

一般查看堆异常情况主要看这个两个部分: Show instance counts for all classes (excluding platform),平台外的所有对象信息。如下图:

这里写图片描述

Show heap histogram 以树状图形式展示堆情况。如下图:

这里写图片描述

具体排查时需要结合代码,观察是否大量应该被回收的对象在一直被引用或者是否有占用内存特别大的对象无法被回收。

一般情况,会down到客户端用工具来分析

jstack命令

jstack用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。

线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源。 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。

另外,jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。

命令格式

jstack [option] LVMID

option参数

-F : 当正常输出请求不被响应时,强制输出线程堆栈-l : 除堆栈外,显示关于锁的附加信息-m : 如果调用到本地方法的话,可以显示C/C++的堆栈

示例

root@web02 home]# jstack -l 29544 | morePicked up _JAVA_OPTIONS: -Dawt.useSystemAAFontSettings=lcd2017-12-15 10:49:21Full thread dump Java HotSpot(TM) 64-Bit Server VM (24.71-b01 mixed mode):"Attach Listener" daemon prio=10 tid=0x00007f2bf4002000 nid=0x2f4f waiting on condition [0x0000000000000000]   java.lang.Thread.State: RUNNABLE   Locked ownable synchronizers:    - None"Abandoned connection cleanup thread" daemon prio=10 tid=0x00007f2bac1fa000 nid=0x5e45 in Object.wait() [0x00007f2c1c672000]   java.lang.Thread.State: TIMED_WAITING (on object monitor)    at java.lang.Object.wait(Native Method)    at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:135)    - locked <0x00000000cab2d240> (a java.lang.ref.ReferenceQueue$Lock)    at com.mysql.jdbc.AbandonedConnectionCleanupThread.run(AbandonedConnectionCleanupThread.java:43)   Locked ownable synchronizers:    - None

分析

线程状态

NEW,未启动的。不会出现在Dump中。
RUNNABLE,在虚拟机内执行的。
BLOCKED,受阻塞并等待监视器锁。
WATING,无限期等待另一个线程执行特定操作。
TIMED_WATING,有时限的等待另一个线程的特定操作。
TERMINATED,已退出的。

Monitor

在多线程的 JAVA程序中,实现线程之间的同步,就要说说 Monitor。 Monitor是 Java中用以实现线程之间的互斥与协作的主要手段,它可以看成是对象或者 Class的锁。每一个对象都有,也仅有一个 monitor。下 面这个图,描述了线程和 Monitor之间关系,以 及线程的状态转换图:

这里写图片描述

进入区(Entrt Set):表示线程通过synchronized要求获取对象的锁。如果对象未被锁住,则迚入拥有者;否则则在进入区等待。一旦对象锁被其他线程释放,立即参与竞争。

拥有者(The Owner):表示某一线程成功竞争到对象锁。

等待区(Wait Set):表示线程通过对象的wait方法,释放对象的锁,并在等待区等待被唤醒。

从图中可以看出,一个 Monitor在某个时刻,只能被一个线程拥有,该线程就是 “Active Thread”,而其它线程都是 “Waiting Thread”,分别在两个队列 “ Entry Set”和 “Wait Set”里面等候。在 “Entry Set”中等待的线程状态是 “Waiting for monitor entry”,而在 “Wait Set”中等待的线程状态是 “in Object.wait()”。 先看 “Entry Set”里面的线程。我们称被 synchronized保护起来的代码段为临界区。当一个线程申请进入临界区时,它就进入了 “Entry Set”队列。对应的 code就像:

synchronized(obj) {.........}

调用修饰

表示线程在方法调用时,额外的重要的操作。线程Dump分析的重要信息。修饰上方的方法调用。

locked <地址> 目标:使用synchronized申请对象锁成功,监视器的拥有者。

waiting to lock <地址> 目标:使用synchronized申请对象锁未成功,在迚入区等待。

waiting on <地址> 目标:使用synchronized申请对象锁成功后,释放锁幵在等待区等待。

parking to wait for <地址> 目标

locked

at oracle.jdbc.driver.PhysicalConnection.prepareStatement- locked <0x00002aab63bf7f58> (a oracle.jdbc.driver.T4CConnection)at oracle.jdbc.driver.PhysicalConnection.prepareStatement- locked <0x00002aab63bf7f58> (a oracle.jdbc.driver.T4CConnection)at com.jiuqi.dna.core.internal.db.datasource.PooledConnection.prepareStatement

通过synchronized关键字,成功获取到了对象的锁,成为监视器的拥有者,在临界区内操作。对象锁是可以线程重入的。

waiting to lock

at com.jiuqi.dna.core.impl.CacheHolder.isVisibleIn(CacheHolder.java:165)- waiting to lock <0x0000000097ba9aa8> (a CacheHolder)at com.jiuqi.dna.core.impl.CacheGroup$Index.findHolderat com.jiuqi.dna.core.impl.ContextImpl.findat com.jiuqi.dna.bap.basedata.common.util.BaseDataCenter.findInfo

通过synchronized关键字,没有获取到了对象的锁,线程在监视器的进入区等待。在调用栈顶出现,线程状态为Blocked。

waiting on

at java.lang.Object.wait(Native Method)- waiting on <0x00000000da2defb0> (a WorkingThread)at com.jiuqi.dna.core.impl.WorkingManager.getWorkToDo- locked <0x00000000da2defb0> (a WorkingThread)at com.jiuqi.dna.core.impl.WorkingThread.run

通过synchronized关键字,成功获取到了对象的锁后,调用了wait方法,进入对象的等待区等待。在调用栈顶出现,线程状态为WAITING或TIMED_WATING。

parking to wait for

park是基本的线程阻塞原语,不通过监视器在对象上阻塞。随concurrent包会出现的新的机制,不synchronized体系不同。

线程动作
线程状态产生的原因

runnable:状态一般为RUNNABLE。in Object.wait():等待区等待,状态为WAITING或TIMED_WAITING。waiting for monitor entry:进入区等待,状态为BLOCKED。waiting on condition:等待区等待、被park。sleeping:休眠的线程,调用了Thread.sleep()。

进入区等待

"d&a-3588" daemon waiting for monitor entry [0x000000006e5d5000]java.lang.Thread.State: BLOCKED (on object monitor)at com.jiuqi.dna.bap.authority.service.UserService$LoginHandler.handle()- waiting to lock <0x0000000602f38e90> (a java.lang.Object)at com.jiuqi.dna.bap.authority.service.UserService$LoginHandler.handle()

线程状态BLOCKED,线程动作wait on monitor entry,调用修饰waiting to lock总是一起出现。表示在代码级别已经存在冲突的调用。必然有问题的代码,需要尽可能减少其发生。

同步块阻塞

一个线程锁住某对象,大量其他线程在该对象上等待。

"blocker" runnablejava.lang.Thread.State: RUNNABLEat com.jiuqi.hcl.javadump.Blocker$1.run(Blocker.java:23)- locked <0x00000000eb8eff68> (a java.lang.Object)"blockee-11" waiting for monitor entryjava.lang.Thread.State: BLOCKED (on object monitor)at com.jiuqi.hcl.javadump.Blocker$2.run(Blocker.java:41)- waiting to lock <0x00000000eb8eff68> (a java.lang.Object)"blockee-86" waiting for monitor entryjava.lang.Thread.State: BLOCKED (on object monitor)at com.jiuqi.hcl.javadump.Blocker$2.run(Blocker.java:41)- waiting to lock <0x00000000eb8eff68> (a java.lang.Object)

持续运行的IO

IO操作是可以以RUNNABLE状态达成阻塞。例如:数据库死锁、网络读写。 格外注意对IO线程的真实状态的分析。 一般来说,被捕捉到RUNNABLE的IO调用,都是有问题的。

以下堆栈显示: 线程状态为RUNNABLE。 调用栈在SocketInputStream或SocketImpl上,socketRead0等方法。 调用栈包含了jdbc相关的包。很可能发生了数据库死锁

"d&a-614" daemon prio=6 tid=0x0000000022f1f000 nid=0x37c8 runnable[0x0000000027cbd000]java.lang.Thread.State: RUNNABLEat java.net.SocketInputStream.socketRead0(Native Method)at java.net.SocketInputStream.read(Unknown Source)at oracle.net.ns.Packet.receive(Packet.java:240)at oracle.net.ns.DataPacket.receive(DataPacket.java:92)at oracle.net.ns.NetInputStream.getNextPacket(NetInputStream.java:172)at oracle.net.ns.NetInputStream.read(NetInputStream.java:117)at oracle.jdbc.driver.T4CMAREngine.unmarshalUB1(T4CMAREngine.java:1034)at oracle.jdbc.driver.T4C8Oall.receive(T4C8Oall.java:588)

分线程调度的休眠

正常的线程池等待

"d&a-131" in Object.wait()java.lang.Thread.State: TIMED_WAITING (on object monitor)at java.lang.Object.wait(Native Method)at com.jiuqi.dna.core.impl.WorkingManager.getWorkToDo(WorkingManager.java:322)- locked <0x0000000313f656f8> (a com.jiuqi.dna.core.impl.WorkingThread)at com.jiuqi.dna.core.impl.WorkingThread.run(WorkingThread.java:40)

可疑的线程等待

"d&a-121" in Object.wait()java.lang.Thread.State: WAITING (on object monitor)at java.lang.Object.wait(Native Method)at java.lang.Object.wait(Object.java:485)at com.jiuqi.dna.core.impl.AcquirableAccessor.exclusive()- locked <0x00000003011678d8> (a com.jiuqi.dna.core.impl.CacheGroup)at com.jiuqi.dna.core.impl.Transaction.lock()

总结

wait on monitor entry: 被阻塞的,肯定有问题
runnable : 注意IO线程
in Object.wait(): 注意非线程池等待

jinfo命令

作用:

jinfo(JVM Configuration info)这个命令作用是实时查看和调整虚拟机运行参数。 之前的jps -v口令只能查看到显示指定的参数,如果想要查看未被显示指定的参数的值就要使用jinfo口令

命令格式:

jinfo [option] [args] LVMID

option参数:

-flag : 输出指定args参数的值-flags : 不需要args参数,输出所有JVM参数的值-sysprops : 输出系统属性,等同于System.getProperties()

示例:

[root@web02 home]# jinfo -flag MaxPermSize 29544-XX:MaxPermSize=268435456

以上命令就是查看PID为29544的MaxPermSize大小

原文地址:
1、http://www.jiagoumi.com/basic-knowledge/1358.html
2、http://www.hollischuang.com/archives/110

原创粉丝点击