因為專案的需要,前陣子開始研究Ganglia這套監控系統,對於各主機即時狀態的呈現,幫助管理者可以快速地瞭解各主機的健康狀況。由於各os環境的不同,在網路上找不到完全詳細的安裝與設定資訊,花了不少時間在看錯誤訊息,試著靠這些訊息來一個一個除錯,讓Ganglia可以正常監控基本主機資訊。關於Ganglia的介紹與原理網路上已經有很多資訊,在這就只記錄完整安裝與設定Ganglia的步驟。
1. 安裝環境準備
本文所採用的安裝環境如下:
- Ubuntu 10.10
- Ganglia 3.3.1
2. 主節點Gmond安裝與設定
- 到Ganglia官方網站http://ganglia.sourceforge.net/ 下載Ganglia套件,目前最新穩定版本為3.3.1。
- 下載後的壓縮檔,解壓縮到磁碟目錄中,本文假設解壓縮到/opt/。解壓縮後資料夾階層如下:
$ cd /opt
~/opt $ ls
ganglia-3.3.1
- 安裝需要的套件(如有套件無法取得,請逐一個別安裝)
$sudo apt-get install build-essential libapr1-dev libconfuse-dev libexpat1-dev python-dev
- 編譯
~/opt$ cd ganglia-3.3.1
~/ganglia-3.3.1 $ sudo ./configure --with-libpcre=no
編譯成功後的畫面
- 安裝
~/ganglia-3.3.1 $ sudo make
~/ganglia-3.3.1 $ sudo make install