當(dāng)前位置: 首頁IT技術(shù)操作系統(tǒng) → 管理員必備的Linux系統(tǒng)監(jiān)控工具

管理員必備的Linux系統(tǒng)監(jiān)控工具

更多

  #1: top - 進程活動

  top提供一個當(dāng)前運行系統(tǒng)實時動態(tài)的視圖,

  也就是正在運行進程。在默認情況下,顯示系統(tǒng)

  中CPU使用率最高的任務(wù),并每5秒鐘刷新一次。

  #2: vmstat -系統(tǒng)活動、硬件及系統(tǒng)信息

  使用vmstat命令可以得到關(guān)于進程、內(nèi)存、

  內(nèi)存分頁、堵塞IO、traps及CPU活動的信息。

  #3: w - 顯示誰已登錄,他們正在做什么?

  w命令顯示系統(tǒng)當(dāng)前用戶及其運行進程的信息。

  #4:uptime - 告訴系統(tǒng)已經(jīng)運行了多久?

  uptime命令過去只顯示系統(tǒng)運行多久,F(xiàn)在,

  可以顯示系統(tǒng)運行多久、當(dāng)前有多少的用戶登錄、

  在過去的1,5,15分鐘里平均負載時多少。

  #5:ps - 顯示進程

  ps命令顯示當(dāng)前運行進程的快照。使用-A或-

  e 顯示所有進程。ps 與 top 非常相似,但ps 提

  供更多的信息。

  #6: free - 內(nèi)存使用情況

  free命令顯示系統(tǒng)中空閑的、已用的物理內(nèi)存

  及swap內(nèi)存,及被內(nèi)核使用的buffer。

  #7: iostat - CPU平均負載,硬盤活動

  iostat命令可報告中央處理器(CPU)的統(tǒng)計

  信息,各種設(shè)備、分區(qū)及網(wǎng)絡(luò)文件系統(tǒng)輸入/輸出

  的統(tǒng)計信息。

  #8: sar - 搜集和報告系統(tǒng)活動

  sar命令用來搜集、報告和儲存系統(tǒng)活動信息。

  #9:mpstat - 多處理器使用率

  mpstat命令可以顯示所有可用處理器的使用

  情況,處理器編號從 0開始。mpstat -P ALL 顯

  示每個處理器的平均使用率。

  #10: pmap - 進程的內(nèi)存使用

  pmap命令可以顯示進程的內(nèi)存映射,使用這

  個命令可以找出造成內(nèi)存瓶頸的原因。

  #11:netstat - 網(wǎng)絡(luò)相關(guān)信息

  netstat 可以顯示網(wǎng)絡(luò)鏈接、路由表信息、接

  口統(tǒng)計信息、偽裝鏈接和多播成員(multicast

  memberships)

  #12:ss - 網(wǎng)絡(luò)相關(guān)信息

  ss命令用來顯示網(wǎng)絡(luò)套接字信息,它允許顯示

  類似netstat一樣的信息。

  #13: iptraf - 網(wǎng)絡(luò)實時信息

  iptraf是一個可交互式的IP網(wǎng)絡(luò)監(jiān)控工具。它

  可以生成多種網(wǎng)絡(luò)統(tǒng)計信息包括:TCP 信息、

  UDP數(shù)量、ICMP和OSPF信息、以太網(wǎng)負載信

  息、節(jié)點狀態(tài)、IP校驗錯誤等。

  #14:tcpdump:詳細的網(wǎng)絡(luò)流量分析

  tcpdump 是一個簡單網(wǎng)絡(luò)流量轉(zhuǎn)儲工具,然

  而要使用好需要對TCP/IP協(xié)議非常熟悉。

  #15:strace - 系統(tǒng)調(diào)用

  追蹤系統(tǒng)調(diào)用和型號,這對于調(diào)試 Web服務(wù)

  器和其他服務(wù)器非常有用。了解怎樣追蹤進程和

  他功能。

  #16:/proc文件系統(tǒng) - 各種內(nèi)核信息

  /proc目錄下文件提供了很多不同硬件設(shè)備和

  內(nèi)核的詳細信息。

  #17:Nagios - 服務(wù)器及網(wǎng)絡(luò)監(jiān)控

  Nagios 是一款非常流行的系統(tǒng)及網(wǎng)絡(luò)監(jiān)控軟

  件。你可以輕松監(jiān)控所有的主機、網(wǎng)絡(luò)設(shè)備及服

  務(wù)。它能在發(fā)生故障和重新恢復(fù)后發(fā)送警訊。

  #18:Cacti - 基于Web的監(jiān)控工具

  Cacti是一套完成的網(wǎng)絡(luò)圖形化解決方案,基

  于RRDTool的資料存儲和圖形化功能。Cacti提

  供一個快速的輪詢器、進階的圖形化模板、多種

  數(shù)據(jù)采集方法和用戶管理功能。這些功能都擁有

  非常友好易用的界面,確?梢圆渴鹪谝粋包含

  數(shù)百臺設(shè)備的復(fù)雜網(wǎng)絡(luò)中。它提供關(guān)于網(wǎng)絡(luò)

  CPU、內(nèi)存、已登錄用戶、Apache、DNS等信

  息。

  #19:KDE System Guard

  KSysguard 是在 KDE 桌面下一個網(wǎng)絡(luò)化的系

  統(tǒng)監(jiān)控工具。這個工具可以通過SSH會話運行。

  它提供很多功能,例如可以監(jiān)控本機和遠程主機

  的客戶端/服務(wù)器架構(gòu),前端圖形界面使用所謂傳

  感器得到信息并展現(xiàn)出來。傳感器返回的可以是

  一個簡單的數(shù)值或是一組表格的信息。針對不同

  的信息類型,提供一個或多個顯示。這些顯示被

  組織多個工作表中,可以工作表可以獨體儲存和

  加載。所以,KSysguard不只是一個簡單的任務(wù)

  管理器,還是一個可以控制多臺服務(wù)器的強大工

  具。

  #20:Gnome System Monitor

  System Monitor可以顯示系統(tǒng)基本信息、監(jiān)

  控系統(tǒng)進程、系統(tǒng)資源及文件系統(tǒng)使用率。你也

  可以使用System Monitor監(jiān)控和修改系統(tǒng)行為。

  盡管沒有KDE System Guard功能強大,但其提

  供的基本信息對于入門用戶還是非常有用的。

  Linux常用監(jiān)控命令簡介 - top

  指令介紹

  -b : 批次模式運行。

  -c : 顯示執(zhí)行任務(wù)的命令行。

  -d : 設(shè)定延遲時間

  -h : 幫助

  -H : 顯示線程。將顯示所有進程產(chǎn)生的線程。

  -i : 顯示空閑的進程。

  -n : 執(zhí)行次數(shù)。一般與-b搭配使用

  -u : 監(jiān)控指定用戶相關(guān)進程

  -U : 監(jiān)控指定用戶相關(guān)進程

  -p : 監(jiān)控指定的進程。

  -s : 安全模式操作

  -S : 累計時間模式

  -v : 顯示top版本,然后退出。

  -M : 自動顯示內(nèi)存單位(k/M/G)

  top作為日常管理工作中最常用也是最重要的

  Linux 系統(tǒng)監(jiān)控工具之一,可以動態(tài)觀察系統(tǒng)進

  程狀況。top命令顯示的項目很多,默認值是每

  5秒更新一次,按q鍵可以退出。顯示的各項目

  為:

  輸出數(shù)值解讀 為:

  15:06:57 up 129 days, 19:03, 5 users, load average: 1.21, 1.20, 1.25

  uptime 該項顯示的是系統(tǒng)啟動時間、已經(jīng)運行的時間和三個平均負載值(最近1秒,5秒,15秒的

  負載值)。

  222 processes: 219 sleeping, 2 running, 1 zombie, 0 stopped

  processes 自最近一次刷新以來的運行進程總數(shù)。這些進程被分為正在運行的,休眠的,停止的。

  CPU states: cpu user nice system irq softirq iowait idle

   total 0.9% 0.0% 27.4% 0.0% 0.0% 0.2% 71.2%

   cpu00 1.9% 0.0% 19.4% 0.0% 0.0% 0.0% 78.6%

   cpu01 0.0% 0.0% 33.0% 0.0% 0.0% 0.0% 66.9%

   cpu02 1.9% 0.0% 22.3% 0.0% 0.0% 0.9% 74.7%

   cpu03 0.0% 0.0% 35.2% 0.0% 0.0% 0.0% 64.7%

  CPU states 顯示用戶模式,系統(tǒng)模式,優(yōu)先級進程(只有優(yōu)先級為負的列入考慮)和閑置等各種

  情況所占用CPU時間的百分比。優(yōu)先級進程所消耗的時間也被列入到用戶和系統(tǒng)的時間中,所以總

  的百分比將大于100%。

  Mem: 16214336k av, 15682832k used, 531504k free, 0k shrd, 215016k buff

   10896844k actv, 3379680k in_d, 446432k in_c

  Mem 內(nèi)存使用情況統(tǒng)計,其中包括總的可用內(nèi)存,空閑內(nèi)存,已用內(nèi)存,共享內(nèi)存和緩存所占內(nèi)存

  的情況。

  Swap: 10482404k av, 0k used, 10482404k free 14856500k cached

  Swap 交換空間統(tǒng)計,其中包括總的交換空間,可用交換空間,已用交換空間。

  PID USER PRI NI SIZE rss SHARE STAT %CPU %MEM TIME CPU COMMAND

  27869 root 25 0 460M 460M 455M R 25.0 2.9 12559m 1 vmware-vmx

  31819 root 16 0 6016 6016 5048 S 1.6 0.0 17573m 2 magicdev

  27837 root 15 -10 460M 460M 455M S < 0.7 2.9 1328m 0 vmware-vmx

  27868 root 15 -10 460M 460M 455M S < 0.3 2.9 644:35 3 vmware-vmx

  PID 每個進程的ID。PPID 每個進程的父進程ID。UID 每個進程所有者的UID 。

  USER 每個進程所有者的用戶名。

  PRI 每個進程的優(yōu)先級別。

  NI 該進程的優(yōu)先級值。

  SIZE 該進程的代碼大小加上數(shù)據(jù)大小再加上堆棧空間大小的總數(shù)。單位是KB。

  TSIZE 該進程的代碼大小。對于內(nèi)核進程這是一個很奇怪的值。

  DSIZE 數(shù)據(jù)和堆棧的大小。

  TRS 文本駐留大小。

  D 被標記為“不干凈”的頁項目。

  LIB 使用的庫頁的大小。對于ELF進程沒有作用。

  RES 該進程占用的物理內(nèi)存的總數(shù)量,單位是KB。

  SHARE 該進程使用共享內(nèi)存的數(shù)量。

  STAT 該進程的狀態(tài)。S=休眠;D=不可中斷的休眠;R=運行;Z=僵死;T=停止或跟蹤。

  TIME 該進程自啟動以來所占用的總CPU時間。如果進入的是累計模式,那么該時間還包括這個進程

  子進程所占用的時間。且標題會變成CTIME。

 。PU 該進程自最近一次刷新以來所占用的CPU時間和總時間的百分比。

 。EM 該進程占用的物理內(nèi)存占總內(nèi)存的百分比。

  COMMAND 該進程的命令名稱,如果一行顯示不下,則會進行截取。內(nèi)存中的進程會有一個完整的命

  令行。

 。篖inux常用監(jiān)控命令簡介 – vmstat,ps等

  vmstat [-a] [-n] [delay [ count]]

  vmstat [-f] [-s] [-m]

  vmstat [-S unit]

  vmstat [-d]

  vmstat [-p disk partition]

  vmstat [-V]

  指令介紹

  -a:顯示活躍和非活躍內(nèi)存

  -f:顯示從系統(tǒng)啟動至今的fork數(shù)量 。

  -m:顯示slabinfo

  -n:只在開始時顯示一次各字段名稱。

  -s:顯示內(nèi)存相關(guān)統(tǒng)計信息及多種系統(tǒng)活動數(shù)。

  delay:刷新時間間隔。如果不指定,只顯示

  一條結(jié)果。

  count:刷新次數(shù)。如果不指定刷新次數(shù),但

  指定了刷新時間間隔,這時刷新次數(shù)為無窮。

  -d:顯示磁盤相關(guān)統(tǒng)計信息。

  -p:顯示指定磁盤分區(qū)統(tǒng)計信息

  -S:使用指定單位顯示。參數(shù)有 k , K, m, M,

  分別代表 1000, 1024, 1000000, 1048576

  字節(jié)。默認單位為K(1024 bytes)

  -V:顯示vmstat版本信息。

  方便用法推薦

  每2秒輸出一條結(jié)果

  vmstat 2

  顯示活躍和非活躍內(nèi)存

  vmstat -a 2

  輸出數(shù)值解讀

  (Procs)r: 運行隊列中進程數(shù)量

  (Procs)b: 等待IO的進程數(shù)量

  (Memory)swpd: 使用虛擬內(nèi)存大小

  (Memory)free: 可用內(nèi)存大小

  (Memory)buff: 用作緩沖的內(nèi)存大小

  (Memory)cache: 用作緩存的內(nèi)存大小

  (Swap)si: 每秒從交換區(qū)寫到內(nèi)存的大小

  (Swap)so: 每秒寫入交換區(qū)的內(nèi)存大小

  (IO)bi: 每秒讀取的塊數(shù)

  (IO)bo: 每秒寫入的塊數(shù)

  (System)in: 每秒中斷數(shù),包括時鐘中斷。

  (System)cs: 每秒上下文切換數(shù)。

  (CPU)us: 用戶進程執(zhí)行時間(user time)

  (CPU)sy: 系統(tǒng)進程執(zhí)行時間(system time)

  (CPU)id: 空閑時間(包括IO等待時間)

  (CPU)wa: 等待IO時間

  ps 命令

  ps [options]

  指令介紹

  -e 顯示所有進程。

  -f 全格式。

  -h 不顯示標題。

  -l 長格式。

  -w 寬輸出。

  a 顯示終端上的所有進程,包括其他用戶的

  r 只顯示正在運行的進程。

  x 顯示沒有控制終端的進程。

  方便用法推薦

  查看使用Vivek用戶名運行的進程

  # ps -U vivek -u vivek u

  只顯示Lighttpd的進程ID

  # ps -C lighttpd -o pid=

  找出消耗內(nèi)存最多的前10名進程

  # ps -auxf | sort -nr -k 4 | head -10

  找出使用CPU最多的前10名進程

  # ps -auxf | sort -nr -k 3 | head -10

  free 命令

  free [-b|-k|-m][-o][-s delay][-t][-V]

  指令介紹

  -b 以Byte為單位顯示內(nèi)存使用情況。

  -k 以KB為單位顯示內(nèi)存使用情況。

  -m 以MB為單位顯示內(nèi)存使用情況。

  -o 不顯示緩沖區(qū)調(diào)節(jié)列。

  -s<間隔秒數(shù)> 持續(xù)觀察內(nèi)存使用狀況。

  -t 顯示內(nèi)存總和列。

  -V 顯示版本信息。

  輸出數(shù)值解讀

  total used free shared buffers cached

  Mem: 3266180 3250004 16176 0 110652

  2668236

  -/+ buffers/cache: 471116 2795064

  Swap: 2048276 80160 1968116

  total:總計物理內(nèi)存的大小。

  used:已使用多大。

  free:可用有多少。

  Shared:多個進程共享的內(nèi)存總額。

  Buffers/cached:磁盤緩存的大小。

  used:已使用多大。

  free:可用有多少。

  uptime 命令

  uptime

  uptime [-V]

  輸出數(shù)值解讀

  18:02:41 up 41 days, 23:42, 1 user,

  load average: 0.00, 0.00, 0.00

  10:19:04:系統(tǒng)當(dāng)前時間

  up 257 days, 18:56:主機已運行時間,時間越

  大,說明你的機器越穩(wěn)定。

  12 user:用戶連接數(shù),是總連接數(shù)而不是用戶

  數(shù)

  load average:系統(tǒng)平均負載,統(tǒng)計最近1, 5,

  15分鐘的系統(tǒng)平均負載

  如果每個CPU內(nèi)核的當(dāng)前活動進程數(shù)不大于3的

  話,那么系統(tǒng)的性能是良好的。如果每個CPU內(nèi)

  核的任務(wù)數(shù)大于5,那么這臺機器的性能有嚴重

  問題。

熱門評論
最新評論
發(fā)表評論 查看所有評論(0)
昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
字數(shù): 0/500 (您的評論需要經(jīng)過審核才能顯示)