常用PC服務器陣列卡、硬盤健康監(jiān)控 葉金榮
通常,我們使用的DELL/HP/IBM三家的機架式PC級服務器陣列卡是從LSI的卡OEM出來的,DELL和IBM兩家的陣列卡原生程度較高,沒有做太多封裝,可以用原廠提供的陣列卡管理工具進行監(jiān)控;而HP的陣列卡一般都做過封裝了,因此需要使用自身特有的管理工具來監(jiān)控。
本文以幾種常用的陣列卡為例,展示其陣列卡及硬盤監(jiān)控的方法。
DELL SAS 6/iR卡,全稱LSI Logic SAS1068E,只支持RAID 0, RAID 1, RAID 1+0, 不支持RAID 5等高級RAID特性,不支持陣列卡電池。
DELL PERC PERC H700卡,全稱LSI Logic MegaRAID SAS 2108,支持各種RAID級別及高級特性,可選配陣列卡電池。
DELL PERC H310 Mini卡,全稱LSI Logic / Symbios Logic MegaRAID SAS 2008,支持常見RAID級別,不支持高級RAID特性,不支持陣列卡電池。
IBM ServeRAID M5014 SAS/SATA Controller卡,全稱LSI Logic / Symbios Logic MegaRAID SAS 2108,支持各種RAID級別及高級特性,可選配陣列卡電池。
IBM ServeRAID-MR10i SAS/SATA Controller卡,全稱LSI Logic / Symbios Logic MegaRAID SAS 1078,支持常見RAID級別,不支持高級RAID特性,可選配陣列卡電池,這個卡其實和DELL的PERC 6/i卡是一樣的,都是基于LSI MegaRAID SAS 1078基礎上OEM出來的。
上面是幾種常見的陣列卡型號,更多的可以自行查看官方的技術手冊。
下面我們要繼續(xù)的是,這些陣列卡以及硬盤如何監(jiān)控,陣列卡的管理也請查看官方技術手冊,不在本文討論范疇,或者查看作者的一個分享PPT:。
一般地,支持RAID 5的卡,我們稱其為陣列卡,都可以使用LSI官方提供的MegaCli工具來管理,而不支持RAID 5的卡,我們稱其為SAS卡,使用lsiutil工具來管理。HP的服務器使用其特有的hpacucli工具來管理。
1、MegaCli工具
a) MegaCli -adpallinfo -aall — 查看陣列卡信息
-a 參數指定陣列卡的編號,一般服務器上只會配一個陣列卡,因此我們通常指定為 -a0(陣列卡適配器編號,從0開始) 即可,主要關注下面幾個信息:
狀態(tài)值 | 對應含義 |
Product Name : PERC H710 Mini | 陣列卡名稱 |
FW Package Build: 21.2.0-0007 | 陣列卡firmware版本號,版本如果太低,建議升級以提高穩(wěn)定性及性能 |
BBU : Present | 是否有配BBU電池 |
b) MegaCli -cfgdsply -aall — 查看陣列配置
狀態(tài)值 | 對應含義 |
Memory: 512MB | 陣列卡cache大小,2的N次方,如果不是,說明陣列卡有異常 |
Number of dedicated Hotspares: 0 | 陣列是否有專用/獨享熱備盤(如果有多個邏輯磁盤組/disk group,則可以指定一個硬盤用于全局熱備,那么該disk group上的專用熱備盤數量為0也不用擔心),除了RAID 1/RAID 1+0一般不指定熱備盤以外,其他幾個陣列級別建議都要指定熱備盤 |
State : Optimal | 陣列狀態(tài),如果不是 Optimal 就要關注了 |
Current Cache Policy: WriteBack, ReadAheadNone, Direct, Write Cache OK if Bad BBU | 陣列讀寫cache策略,建議寫策略設置為FORCE WB,最起碼是WB,預讀策略可以關掉,意義不大,幾乎沒影響 |
Disk Cache Policy : Disabled | 硬盤cache策略,建議關閉,防止意外時數據丟失 |
Current Power Savings Policy: None | 節(jié)電策略,建議關閉 |
Media Error Count: 0 | 三個錯誤計數器,任何一個值大于100就要立刻引起關注,尤其要關注起增長速度。1T以上SATA盤,計數值不夠精確,可能所有盤上該值都會大于0,一般重啟就會重新清0,如果重啟后還是大于0的話,趕緊報修吧。SAS盤的計數值則比較準確。 |
Other Error Count: 0 | |
Predictive Failure Count: 0 | |
Firmware state: Online, Spun Up | 查看硬盤狀態(tài),如果是unconfigured表示該硬盤未分配加入到陣列中;如果是 unconfigured(bad)表示該盤不但是未分配,而且還壞了,正是“出師未捷身先死”;如果是failed,表示該盤故障無法識別;如果是rebuilding,表示該盤正在重建數據 |
c) MegaCli -adpbbucmd -aall — 查看陣列卡電池信息
狀態(tài)值 | 對應含義 |
Temperature: 39 C | 查看電池溫度,如果相比上一次查看高出不少,就需要關注了,或者可以根據經驗設置一個基線值 |
Battery State: Optimal | 電池狀態(tài),如果不是為Optimal,就需要關注了 |
Charger Status: Complete | 電池充放電狀態(tài) |
isSOHGood: Yes | 電池狀態(tài),如果不是為Yes,需要關注 |
Relative State of Charge: 93 % | 當前電量,當電量低于15%,或者電池壞掉時,默認都會將寫策略從WB改成WT,除非設定為FORCE WB策略 |
Max Error = 0 % | 電池是否有錯誤信息 |
Next Learn time: Tue Oct 14 22:06:50 2014 | 電池充放電時間,注意這是美國時間。另外,新的陣列卡電池很多改成電容式的了,也就不需要重復充放電了 |
d) MegaCli -fwtermlog -dsply -aALL 查看陣列卡日志,關注里面的error/fail/warn等多個關鍵字
2、lsiutil工具
lsiutil有交互和非交互兩種方式,作為監(jiān)控,我們肯定選擇非交互模式。想要使用交互模式的,可以根據非交互模式自行練習。
a) lsiutil -p 1 -a 20,12,0,0 — 查看硬盤計數器
Invalid DWord Count 2,563 — 任何一個值大于0,都需要引起關注
Running Disparity Error Count 2,366
Loss of DWord Synch Count 0
Phy Reset Problem Count 0
b) lsiutil -p 1 -a 21,1,0,0,0 — 查看邏輯卷狀態(tài)
狀態(tài)值 | 對應含義 |
Volume State: optimal, enabled | 邏輯卷健康狀況 |
Volume draws from Hot Spare Pools: 0 | 是否有熱備 |
Volume Size 139392 MB, 2 Members | 由幾塊硬盤組成 |
Primary is PhysDisk 1 (Bus 0 Target 9) | 物理硬盤1 |
Secondary is PhysDisk 0 (Bus 0 Target 3) | 物理硬盤0 |
c) lsiutil -p 1 -a 21,2,0,0,0 — 查看物理硬盤狀態(tài)
狀態(tài)值 | 對應含義 |
PhysDisk 0 is Bus 0 Target 3 | 編號 |
PhysDisk State: online | 狀態(tài) |
Error Count 13, Last Error: Command = 28h, Key = 3, ASC/ASCQ = 11h/00h | 錯誤計數器,大于0的話,就需要引起關注 |
3、hpacucli工具
hpacucli工具查看陣列、硬盤、電池信息,其實就只要一條指令:
hpacucli ctrl all show config detail — 查看陣列詳細信息、配置
狀態(tài)值 | 對應含義 |
Controller Status: OK | 陣列卡狀態(tài) |
Firmware Version: 1.18 | firmware版本,太低了建議升級,以提高穩(wěn)定性及性能 |
Cache Board Present: True | 是否配備了cache模塊 |
Cache Status: OK | cache模塊狀態(tài) |
Cache Ratio: 100% Read / 0% Write | cache策略,此處只有讀cache,不用于寫cache,因為沒有bbu電池,見下方結果 |
Drive Write Cache: Disabled | 關閉磁盤cache |
Total Cache Size: 256 MB | cache大小 |
Total Cache Memory Available: 208 MB | 實際可用cache大小,和理論cache大小不一樣,說明cache模塊可能有問題 |
No-Battery Write Cache: Disabled | 關閉FORCEWB策略 |
Battery/Capacitor Count: 0 | 陣列卡BBU電池數量為0,也就是沒有BBU模塊 |
Battery/Capacitor Status: Failed (Replace Batteries) | 陣列卡BBU電池狀態(tài),這里顯示是錯誤狀態(tài),需要及時更換 |
Array: A | 第一個烏列陣列,編號從A開始,依次是A、B、C |
Status: OK | 物理陣列狀態(tài) |
Logical Drive: 1 | 第一個邏輯卷,編號從1開始 |
Fault Tolerance: RAID 5 | 第一個邏輯卷的陣列級別 |
Status: OK | 第一個邏輯卷狀態(tài) |
Caching: Enabled | 第一個邏輯卷是否啟用了cache策略 |
physicaldrive 1I:1:1 | 第一塊物理硬盤,編號從1開始 |
Status: OK | 第一塊物理硬盤狀態(tài) |
Firmware Revision: HPDA | 第一塊物理硬盤firmware,如果太低,也需要及時升級,HP的硬盤每個批次都有不同的firmware |
延伸閱讀:
推薦系統(tǒng)
番茄花園win10純凈版 20h2 Ghost x64 系統(tǒng)下載 v2022.06
系統(tǒng)大?。?/em>4.92GB系統(tǒng)類型:Win10番茄花園win10純凈版 20h2 Ghost鏡像 x64 ISO系統(tǒng)下載在系統(tǒng)方面技術積累雄厚深耕多年,是一款穩(wěn)定流暢的系統(tǒng),一直以來都以用戶為中心,兼容各種硬件和軟件,運行環(huán)境安全可靠穩(wěn)定。
系統(tǒng)等級:進入下載 >Win10專業(yè)版系統(tǒng)下載 技術員聯(lián)盟 ghost鏡像 ISO v2022.07 下載
系統(tǒng)大?。?/em>4.48GB系統(tǒng)類型:Win10win10系統(tǒng)下載 技術員聯(lián)盟 win10專業(yè)版 ghost鏡像 ISO下載在系統(tǒng)方面技術積累雄厚深耕多年,打造了國內重裝系統(tǒng)行業(yè)的番茄品牌,其系統(tǒng)口碑得到許多人認可,積累了廣大的用戶群體,win10是一款穩(wěn)定流暢的系統(tǒng),一直以來都以用戶為中心,是由技術員聯(lián)盟推出的win10國內鏡像版,基于國內用戶的習慣,做了系統(tǒng)性能的優(yōu)化,采用了新的系統(tǒng)功能和硬件驅動,
系統(tǒng)等級:進入下載 >技術員聯(lián)盟Win10純凈版系統(tǒng)下載 ghost鏡像 ISO v2022.07 下載
系統(tǒng)大?。?/em>4.48GB系統(tǒng)類型:Win10技術員聯(lián)盟在系統(tǒng)方面技術積累雄厚深耕多年,技術員聯(lián)盟Win10純凈版系統(tǒng)下載 Windows11純凈版 GHOST ISO鏡像系統(tǒng),是由番茄團隊推出的win10國內鏡像版,基于國內用戶的習慣,做了系統(tǒng)性能的優(yōu)化,采用了新的系統(tǒng)功能和硬件驅動,可以更好的發(fā)揮系統(tǒng)的性能,優(yōu)化了系統(tǒng)、驅動對硬件的加速,使得軟件在windows10系統(tǒng)中運行得更加流暢,加固了系統(tǒng)安全策略
系統(tǒng)等級:進入下載 >微軟Windows11下載 專業(yè)版 品牌機專用 Ghost系統(tǒng) ISO鏡像 X64位系統(tǒng)
系統(tǒng)大?。?/em>4.68GB系統(tǒng)類型:Win11技術員聯(lián)盟打造了國內重裝系統(tǒng)行業(yè)的系統(tǒng)之家品牌,微軟Windows11下載 專業(yè)版 品牌機專用 Ghost系統(tǒng) ISO鏡像 X64位系統(tǒng)追求系統(tǒng)穩(wěn)定性和強大的兼容,為廣大用戶提供最好用的系統(tǒng),WINDOWS11系統(tǒng)在家用辦公上跑分表現都是非常優(yōu)秀,完美的兼容各種硬件和軟件,運行環(huán)境安全可靠穩(wěn)定。
系統(tǒng)等級:進入下載 >技術員聯(lián)盟win7純凈版 ghost 官網鏡像 x64位下載 v2022.07
系統(tǒng)大小:4.42GB系統(tǒng)類型:Win7技術員聯(lián)盟win7純凈版 ghost 官網鏡像 windows7純凈版 x64位下載在系統(tǒng)方面技術積累雄厚深耕多年,打造了國內重裝系統(tǒng)行業(yè)的領頭羊,其系統(tǒng)口碑得到許多人認可,積累了廣大的用戶群體,windows7是一款穩(wěn)定流暢的系統(tǒng),一直以來都以用戶為中心,是由技術員聯(lián)盟團隊推出的windows7國內鏡像版,基于國內用戶的習慣,做了系統(tǒng)性能的優(yōu)化,采用了新的系統(tǒng)功
系統(tǒng)等級:進入下載 >聯(lián)想/戴爾品牌機專用系統(tǒng) 技術員聯(lián)盟Win11專業(yè)版 完美激活 ghost ISO鏡像 X64下載
系統(tǒng)大?。?/em>4.68GB系統(tǒng)類型:Win11技術員聯(lián)盟打造了國內重裝系統(tǒng)行業(yè)的系統(tǒng)之家品牌,聯(lián)想 戴爾品牌機專用系統(tǒng) 技術員聯(lián)盟Win11專業(yè)版 完美激活 ghost ISO鏡像 X64下載,為廣大用戶提供最好用的系統(tǒng),WINDOWS11系統(tǒng)在家用辦公上跑分表現都是非常優(yōu)秀,完美的兼容各種硬件和軟件,運行環(huán)境安全可靠穩(wěn)定。
系統(tǒng)等級:進入下載 >
相關文章
- 超級數據恢復軟件解決移動硬盤提示未格式化的數據
- 天璣700和天璣1200區(qū)別是什么 天璣700和天璣1200對比介紹
- 告訴大家筆記本電腦快速充電是如何實現的?
- 彩噴常見故障處理方法
- 麒麟985和麒麟990哪款跑分高 麒麟985和麒麟990跑分對比
- 天璣900和驍龍768g哪個好?天璣900和驍龍768g哪個性能更強?
- 驍龍778g和驍龍845哪款處理器性能更強 驍龍778g和驍龍845對比
- 華為MateBook筆記本怎么新建分區(qū)?
- 打印機怎么取消正在排隊打印的任務? 打印機刪除打印任務的教程
- 華為watch3和gt2pro區(qū)別是什么 華為watch3和gt2pro對比介紹
- 蘋果筆記本MacBookPro 的新手使用技巧
- 電腦硬件認識之什么是電腦的CPU(cpu詳細介紹)
- AMD RX VEGA64顯卡怎么樣 AMD RX VEGA64首發(fā)性能詳細評測+拆解圖
- AMD RX VEGA64顯卡怎么樣 AMD RX VEGA 64評測
熱門系統(tǒng)
推薦軟件
推薦應用
推薦游戲
熱門文章
常用系統(tǒng)
- 1系統(tǒng)之家windows10系統(tǒng)下載 x64位 專業(yè)版 Ghost 鏡像 win10 v2021.10
- 2微軟Win11系統(tǒng) 64位 正式版Ghost Windows11鏡像 2022.05
- 3系統(tǒng)之家win7旗艦版 ghost系統(tǒng) V2022.05官網鏡像下載
- 4系統(tǒng)之家win7企業(yè)版純凈ghost系統(tǒng) V2022.05鏡像下載
- 5雨林木風win11系統(tǒng)下載 Ghost windows11 64位 專業(yè)版系統(tǒng) V2021.10
- 6蘿卜家園win10專業(yè)版 Ghost系統(tǒng)鏡像下載安裝 V2022.06
- 7深度技術WINDOWS10家庭版 GHOST X64位 V2022.04下載
- 8雨林木風win10系統(tǒng)下載 Ghost windows10 64位 企業(yè)版系統(tǒng) V2021.10
- 9深度技術WINDOWS10純凈版自動激活21H2 X64位 V2022.04下載