linux系統(tǒng)監(jiān)控命令
linux系統(tǒng)監(jiān)控命令
對(duì)于Linux系統(tǒng)來(lái)說(shuō),無(wú)論是中央處理器、內(nèi)存、磁盤驅(qū)動(dòng)器、鍵盤、鼠標(biāo),還是用戶等都是文件,Linux系統(tǒng)管理的命令是它正常運(yùn)行的核心,與之前的DOS命令類似。接下來(lái)是小編為大家收集的linux系統(tǒng)監(jiān)控命令,希望能幫到大家。
linux系統(tǒng)監(jiān)控命令
找到最耗CPU的java線程ps命令
命令:ps -mp pid -o THREAD,tid,time 或者 ps -Lfp pid
結(jié)果展示:
這個(gè)命令的作用,主要是可以獲取到對(duì)應(yīng)一個(gè)進(jìn)程下的線程的一些信息。 比如你想分析一下一個(gè)java進(jìn)程的一些運(yùn)行瓶頸點(diǎn),可以通過(guò)該命令找到所有當(dāng)前Thread的占用CPU的時(shí)間,也就是這里的最后一列。
比如這里找到了一個(gè)TID : 30834 ,所占用的TIME時(shí)間最高。
通過(guò) printf "%xn" 30834 首先轉(zhuǎn)化成16進(jìn)制, 繼續(xù)通過(guò)jstack命令dump出當(dāng)前的jvm進(jìn)程的堆棧信息。 通過(guò)Grep命令即可以查到對(duì)應(yīng)16進(jìn)制的線程id信息,很快就可以找到對(duì)應(yīng)最耗CPU的代碼快在哪。
簡(jiǎn)單的解釋下,jstack下這一串線程信息內(nèi)容:
"DboServiceProcessor-4-thread-295" daemon prio=10 tid=0x00002aab047a9800 nid=0x7d9b waiting on condition [0x0000000046f66000]
nid : 對(duì)應(yīng)的linux操作系統(tǒng)下的tid,就是前面轉(zhuǎn)化的16進(jìn)制數(shù)字
tid: 這個(gè)應(yīng)該是jvm的jmm內(nèi)存規(guī)范中的唯一地址定位,如果你詳細(xì)分析jvm的一些內(nèi)存數(shù)據(jù)時(shí)用得上,我自己還沒(méi)到那種程度,所以先放下
top命令
命令:top -Hp pid
結(jié)果顯示:
和前面的效果一下,你可以實(shí)時(shí)的跟蹤并獲取指定進(jìn)程中最耗cpu的線程。 再用前面的方法提取到對(duì)應(yīng)的線程堆棧信息。
判斷I/O瓶頸
mpstat命令
命令:mpstat -P ALL 1 1000
結(jié)果顯示:
注意一下這里面的%iowait列,CPU等待I/O操作所花費(fèi)的時(shí)間。這個(gè)值持續(xù)很高通??赡苁荌/O瓶頸所導(dǎo)致的。
通過(guò)這個(gè)參數(shù)可以比較直觀的看出當(dāng)前的I/O操作是否存在瓶頸
iostat命令
命令: iostat -m -x 1 1000
同樣你可以觀察對(duì)應(yīng)的CPU中的%iowait數(shù)據(jù),除此之外iostat還提供了一些更詳細(xì)的I/O狀態(tài)數(shù)據(jù),比如比較重要的有:
avgqu-sz : The average queue length of the requests that were issued to the device. (磁盤隊(duì)列的請(qǐng)求長(zhǎng)度,正常的話2,3比較好??梢院蚦pu的load一樣的理解)
await : The average time (in milliseconds) for I/O requests issued to the device to be served. (代表一個(gè)I/O操作從wait到完成的總時(shí)間)
svctm和%util都是代表處理該I/O請(qǐng)求花費(fèi)的時(shí)間和CPU的時(shí)間比例。 判斷是否瓶頸時(shí),這兩個(gè)參數(shù)不是主要的
r/s w/s 和 rMB/s wMB/s 都是代表當(dāng)前系統(tǒng)處理的I/O的一些狀態(tài),前者是我們常說(shuō)的tps,后者就是吞吐量。這也是評(píng)價(jià)一個(gè)系統(tǒng)的性能指標(biāo)
pid命令
命令: pidstat -p pid -u -d -t -w -h 1 1000
結(jié)果顯示:
相當(dāng)實(shí)用的一個(gè)命令,可以基于當(dāng)個(gè)進(jìn)程分析對(duì)應(yīng)的性能數(shù)據(jù),包括CPU,I/O,IR , CS等,可以方便開(kāi)發(fā)者更加精細(xì)化的觀察系統(tǒng)的運(yùn)行狀態(tài)。不過(guò)pidstat貌似是在2.6內(nèi)核的一些較新的版本才有,需要安裝sysstat包。
ubuntu下,可以通過(guò)sudo apt-get install sysstat進(jìn)行安裝。
sar命令
命令:sar -x pid 1 1000
sar也可以指定對(duì)應(yīng)的pid,關(guān)注固定的幾個(gè)參數(shù),沒(méi)有pidstat那么強(qiáng)大。 看不到對(duì)應(yīng)的I/O, IR等信息。
sar的功能可以覆蓋mpstat , iostat的相關(guān)功能。
dstat命令
命令:dstat -y --tcp 1 1000
通過(guò)dstat --tcp可以比較方便的看到當(dāng)前的tcp的各種狀態(tài),不需要每次netstat -nat去看
其他命令
netstat -natp : 查看對(duì)應(yīng)的網(wǎng)絡(luò)鏈接,關(guān)注下Recv-Q , Send-Q , State。
lsof -p pid : 查找對(duì)應(yīng)pid的文件句柄
lsof -i : 80 : 查找對(duì)應(yīng)端口被哪個(gè)進(jìn)程占用
lsof /tmp/1.txt :查找對(duì)應(yīng)文件被哪個(gè)進(jìn)程占用
tcpdump / wireshark :抓包分析工具
jstat / jmap / jstack / jps 等一系列的java監(jiān)控命令
看了“linux系統(tǒng)監(jiān)控命令”還想看:
1.使用PV命令監(jiān)控Linux命令完成情況的方法
2.如何使用top命令監(jiān)控Linux系統(tǒng)性能