監(jiān)控我們的環(huán)境對于服務(wù)器運維來說至關(guān)重要,尤其是在部署新的應(yīng)用程序時。如今,公司每天都使用開源解決方案來監(jiān)控系統(tǒng)資源。但是,當(dāng)出于測試的目的來監(jiān)控一定時間時,bash 腳本會派上用場。
在本教程中,我們將編寫一個 bash shell 腳本,它將輸出一個三列表,來顯示我們機器上的內(nèi)存、磁盤和 CPU 的百分比。讓我們開始吧!
該腳本基本上由三個主要部分組成:
1.監(jiān)控內(nèi)存:
free -m 是用于顯示已使用和空閑內(nèi)存的命令,輸出如下:
但是,我們需要從上面的輸出中獲取第二行的總內(nèi)存和已用內(nèi)存。我們可以使用 AWK 來從給定輸出中提取數(shù)據(jù)。
AWK 是一種用于文本處理和數(shù)據(jù)提取的編程語言。它是大多數(shù) UNIX 系統(tǒng)的標(biāo)準(zhǔn)功能。awk ‘NR==2’ 從第二行提取數(shù)據(jù)。和2 分別充當(dāng)已用量和總量。
監(jiān)控磁盤
第二個命令輸出使用的磁盤百分比。df -h 輸出與磁盤使用情況和分區(qū)相關(guān)的數(shù)據(jù)。
awk 輸出字段數(shù)。但是,NF=="/" 將轉(zhuǎn)到包含字符 / 的那一行。$5 將從該行中選擇第 5 個字段。這可確保該命令能夠提取正確的磁盤使用百分比(在我們的示例中為 %7)。
監(jiān)控 CPU
top -bn1 命令將只執(zhí)行一次 top 命令(n1 = 一次迭代),當(dāng)我們想在 bash 腳本中使用 top 或?qū)⑵鋽?shù)據(jù)輸出到文件時使用可以使用 -b 選項。
grep load 將輸出包含字符串 load 的行。$(NF-2) 將計算該行上的字段數(shù)并減 2。
在瀏覽完 bash 腳本的基本部分之后,我們需要將這些命令保存到變量 MEMORY、DISK 和 CPU 中:
我們需要腳本運行一段時間(比如,一個小時)。為了做到這一點,我們需要使用 while do 循環(huán),每次循環(huán)后延遲 x 秒(取決于您的測試):
為了在一定時間內(nèi)運行一次循環(huán),我們可以定義一個變量 $end,它從 bash 腳本開始的時間開始計算當(dāng)前的秒數(shù),因此是 SECONDS,并在當(dāng)前秒數(shù)上加上一個數(shù)字。所以一個小時就是 3600 秒。
上述代碼片段的第二行指出,只要(當(dāng)前秒數(shù))小于SECONDS+3600,while 循環(huán)就會繼續(xù)執(zhí)行。因此,我們定義了循環(huán)的開始時間和結(jié)束時間,以及將每個循環(huán)暫停 5 秒的睡眠時間。循環(huán)內(nèi)部是每 5 秒將那三個變量分配一次新值,以及將輸出三個資源使用情況的 echo "DISK$CPU"。
完整代碼如下:
上面的代碼將輸出以下內(nèi)容:
您始終可以將數(shù)據(jù)輸出到日志文件:
Stress 測試
由于機器上幾乎沒有任何負載,我們可以使用 stress 來使 CPU 和內(nèi)存負載一段時間。
使用以下命令安裝(在 CentOS 上):
現(xiàn)在我們可以使用命令 stress 來負載我們的機器。例如,通過指定兩個 CPU 密集型進程、一個 I/O 密集型進程和一個內(nèi)存分配器進程,對系統(tǒng)施加 4 個平均負載,如下所示。以下壓力測試將運行 1 小時。
關(guān)于如何為所有系統(tǒng)管理員創(chuàng)建一個非常容易且有用的 bash 腳本的教程到此結(jié)束。