監控系統需要實現的主要功能和樓宇自控項目基本相同,概括起來有以下幾個主要方面。
(一)集中實時監視功能
傳統的機房管理采用的是每天定時巡視的制度,比如早晚各一次檢查,并且將設備的一些核心運行參數進行人工筆錄后存檔。這樣取得的數據只限于特定時段,工作單調而且耗費人力。而集中實時監控功能可解決此問題。
比如對于UPS電源的運行,用戶一般比較關心負載功率、總體負載率、三相是否平衡等參數。如果沒有集中監控,用戶需要分別到機房內的配電室,現場查看UPS的相關運行參數。而實時監控系統通過通信采集設備將當前被監視設備的運行參數采集上來,實時顯示在監控電腦屏幕上,免去了用戶到不同的設備跟前查看數據的麻煩,如果有必要,隨時都可以在辦公室內查看。
(二)報警和事件功能
報警指機房運行中出現異常情況,比如停電事故、漏水事故等。報警的發生意味著機房的運行受到影響,其嚴重程度可用'優先級'的概念來定義。一般監控系統均可設置幾十到上千個優先級以區別報警的嚴重程度。機房內的報警優先級一般劃分為10級即可。
事件指機房運行中發生的一些正常的狀態改變或人為操作。事件不是異常情況,因此不需要像報警一樣立即通知用戶進行處理。但是往往需要進行記錄,以便日后檢查。比如修改精密空調的設置溫度,這就是一個正常的操作事件,但對修改時間、修改人的這些信息進行記錄是有必要的。
報警功能是機房動力環境監控系統最重要的一項功能,原因在于機房內設備和系統運行的安全性要求很高。報警發生后,系統應對報警事件進行記錄,并迅速通知值班人員或管理人員進行處理。報警發生后,一般按以下步驟來進行處理:
(1)通知。首要的是將報警信息告知給相關人員。
(2)確認。表明已經知道報警的發生,正在處理。但此時報警仍然存在,沒有消失。
(3)消除。經過處理,故障消失,設備恢復正常,報警也隨之消失。報警的通知主要采用以下幾種模式來實現。
1.屏幕顯示報警
這是最基本的方法,但也往往是報警信息最詳盡的模式。通過在監控電腦屏幕上顯示醒目的圖案和文字來告知用戶。報警文字是關鍵的信息,一般至少需要明確指出每次報警的幾個關鍵參數:報警時間、報警設備、故障內容、優先級、緊急解決辦法等。其中緊急解決辦法是一個很有必要的功能,因為機房內的輔助設備種類多,最基本的緊急解決辦法就由專業人員盡速響應和處理,因為報警涉及配電、UPS電源、空調、消防等幾個系統,現場值班人員并不能對每種設備都精通,因此能在第一時間給出緊急處理辦法是非常必要的,甚至一個故障設備廠家的維護電話號碼都能解決大問題。
屏幕報警的缺點在于,如果監控電腦旁沒有人,或者沒有人注意,則報警可能被延誤。
這種模式的報警通知面比較小,不能及時傳播給專人。這種報警模式如果結合網絡傳輸,會提高效率,后面章節將會予以介紹。
2.本地語音報警
當報警發生時,監控系統自動通過揚聲器播放報警語音,將報警消息傳遞給現場人員。其傳遞消息面比屏幕顯示報警要廣,但也限于一個房間內。其優點是非常人性化,缺點是傳播面仍然不廣,而且不能定人傳播。
3.電話撥號報警
當報警發生時,監控系統自動通過電話網,撥通系統預設的號碼,對方接聽后,自動播放報警語音,通過電話將報警消息傳遞給相關人員。
這種模式的優點是能夠實現定人播報。如果和管理責任人結合起來,會有比較好的效果。比如管理UPS和電源系統的人員是A,管理空調系統的人員是B,還有其他幾個人C、D、E也幫助進行輔助管理。則當發生UPS故障后,系統直接撥打A的電話,減少了中間環節。但是實現此項功能,監控系統必須具備以下幾個能力,否則效果會大打折扣。
(1)具有線路是否通暢的判斷能力。當撥打的電話號碼占線,系統自動停止這個號碼的撥號。
(2)具有接聽者是否接聽的判斷能力。當接聽者接聽后,系統開始播報報警語音。
(3)具有確認機制。當接聽者接聽后,需要按下某個預先定義的按鍵進行確認操作,表明他已明確知道這個報警的內容。
(4)具有連續重撥的功能。例如,當系統撥打A的手提電話,如果占線或不在服務區,則自動按照系統內預設的順序(假設是A→B→C→D→E)撥打B的電話。如果B接聽了但沒有確認,再自動撥打C的電話……直到有人確認為止。
從上面的電話報警過程來看,電話撥號通知的報警信息要傳達到預先指定的人員,并不是一件順利的過程,因此,確認機制是最為重要的。目前市場上銷售的監控系統并不都具有完善的電話報警手段。
電話報警可通過兩種設備實現:語音Modem和電話語音卡。
4.手機短消息報警
隨著通信業和短信業務的迅猛發展,通過手機短信發送報警信息成了一個有效的手段。其優點在于可以通知很多人,通知面廣。但這種方式仍缺少有效的確認機制,仍然無法判斷是否真正通知到指定的人'不過其發送面廣的優點可以適當彌補這一不足。
5.E-mail報警
通過網絡,將報警信息以電子郵件的形式發送到個人。但此模式的及時性不好,難以保證讓相關人員在第一時間得知消息。
(三)運行歷史數據記錄和趨勢功能
對機房的管理者來說,除了系統的報警功能以外,系統的另一個重要的功能就是歷史數據和趨勢功能。因為機房只是一個存放計算機和網絡設備的場所,隨著事件的推移,機房內的設備數量、型號等都會發生變化,按照目前的趨勢,一般都是越來越多。因此,從機房管理角度,需要能夠擁有機房設備運行的歷史資料,這樣可以通過分析,找出發展趨勢、發現故障隱患。從而大幅度提高機房的管理水平。
歷史數據和趨勢功能主要實現對機房運行的關鍵參數進行長期的記錄,通過調用、查看歷史趨勢圖,進行一些統計分析等。對于數據的記錄,一定要選擇'關鍵參數',而不能什么參數都進行記錄,同時應注意參數記錄的頻率。因此,詳細了解用戶的需求非常重要。因為,如果記錄數據量太大,對基于PC架構運行的監控系統,其存儲能力受到比較大的限制。比如,功率參數是一個關鍵參數,如果每秒記錄一次參數值,假設在數據庫中占用4個字節,則一年就需要記錄31536000次,需要的硬盤容量是126M,而100個參數就需要幾十個G的容量,在調用數據時將會非常緩慢,記錄數據時因對系統要求很高,也容易造成系統癱瘓。這個問題雖然可以采用實時數據庫來解決,但費用昂貴。因此,對于需求的具體分析非常必要。按照機房運行的規律,建議模擬參數記錄頻率在lOmin以上一次。報警數據則因其量小,發生頻率低,應全部記錄。這樣既可保證資料的相對完善,又極大地減少了數據量。
(四)用戶管理功能
用戶管理主要是對監控系統的使用者進行權限管理,避免末授權的人員隨意修改參數設置或者查看。而授權需要進行分級控制,不同級別的用戶只能進行自己這個級別內所允許的操作。
(五)計劃安排功能
通過事件計劃表,定時執行一些操作,比如系統資料的備份、下班定時關燈等。該功能在機房內使用不多,但隨著機房監控系統的不斷完善,可以滿足更多的用戶需求。
(六)報表功能
數據報表在工控系統中是必不可少的一部分,是數據顯示、查詢、分析、統計、打印的最終體現,是整個控制系統最終結果輸出的重要組成部分,是對機房監控過程中系統監控對象的狀態的綜合記錄和規律總結。一般有實時數據報表、歷史數據報表(班報表、日報表、月報表等)。用戶通過報表的過濾器選項,將自己感興趣的內容打印出來,便于分析存檔。
(七)遠程管理功能
遠程管理主要是指利用目前日益完善的網絡資源,使操作人員不再局限在監控主機旁操作,而能夠在其他地點對系統進行控制。一般監控主機安裝在機房的監控室內,但并不是所有的機房都是24h有人職守。通過遠程管理,操作員可以在辦公室、外地等地進行管理,消除了地域限制。比如省級機房和地市級機房,如果都設置全職管理員的話,人力資源上浪費較大。而通過網絡,可以將監控系統在省里集中監控,地市上不再需要設置專人。當運行有問題時,通過前面的多種報警通知模式,省上和地市均可得到消息,從而可以快速解決問題。
(八)運行設置和控制功能
除了主要的監視功能,系統還應具備控制能力。在大多數機房中,控制對象主要是非電源類設備,比如空調、通風、照明等系統。由于電源設備的可靠性要求極高,進行控制操作時(比如開/關機等)很可能因為誤操作造成機房癱瘓,因此不進行控制,只進行監視。
(九)安全冗余功能
由于機房環境動力監控系統監視著機房的運行,如果自身出現故障,將無法進行監視,降低了管理的安全性。因此,在要求機房有很高的安全管理水平時,往往采取冗余的辦法解決自身的可靠性。一般通過以下兩種方式實現。根據對可靠性要求的高低和實際故障隱患的大小,兩種方式既可同時使用,也可單獨采用。
采控設備的冗余:負責監控計算機與現場被監控設備通信的采控設備承擔著雙向的數據傳輸工作,對其備份可以提高傳輸的可靠性。
監控計算機的冗余,由于監控系統一般均運行于PC平臺的硬件上,而且操作系統以Windows200O和XP為主,因此,計算機硬件、操作系統和監控軟件自身的故障都會造成系統停止工作。可以通過局域網的TCP/IP協議將兩臺裝有同樣軟件的計算機配置成熱備份冗余運行,一臺為主機,一臺為從機。
相對而言,計算機和軟件系統出問題的概率高,對機房內的監控做冗余,建議做計算機的冗余,即采用雙機熱備份方式。
雙機熱備主要是實時數據、報警信息和變量歷史記錄的熱備。主/從機都正常工作時,主機從設備采集數據,并產生報警和事件信息。從機通過網絡從主機獲取實時數據和報警信息,而不會從設備讀取或自己產生報警信息。主/從機都各自記錄變量歷史數據。同時,從機通過網絡監聽主機,從機與主機之間的監聽采取請求與應答的方式,從機以一定的時間間隔(查詢間隔)向主機發出請求,主機應答表示工作正常,主機如果沒有作出應答,從機將切斷與主機的網絡數據傳輸,轉入活動狀態,改由下位設備獲取數據,并產生報警和事件信息。此后,從機還會定時監聽主機狀態,一旦主機恢復,就切換到熱備狀態。通過這種方式實現了熱備。當主機正常運行,從機后啟動時,主機先將實時數據和當前報警緩沖區中的報警和事件信息發送到從機上,完成實時數據的熱備份。然后主/從機同步,暫停變量歷史數據記錄,從機從主機上將所缺的歷史記錄文件通過網絡拷貝到本地,完成歷史數據的熱備份。這時可以在主/從機組態王信息窗中看到提示信息'開始備份歷史數據'和'停止備份歷史數據'。歷史數據文件備份完成后,主/從機轉人正常工作狀態。當從機正常運行,主機后啟動時,從機先將實時數據和當前報警緩沖區中的報警和事件信息發送到主機上,完成實時數據的熱備份。然后主/從機同步,暫停變量歷史數據記錄,主機從從機上將所缺的歷史記錄文件通過網絡拷貝到木地,完成歷史數據的熱備份。這時也可以在主/從機的組態主信息窗中看到提示信息'開始備份歷史數據'和'停止備份歷史數據'。歷史數據文件備份完成后,主/從機轉人正常工作狀態。
雙機熱備的構造思想是主機和從機通過TCP/IP網絡連接,正常情況下主機處于工作狀態,從機處于監視狀態,一旦從機發現主機異常,從機將會在很短的時間之內代替主機,完全實現主機的功能。例如,1/0服務器的熱備機將進行數據采集,報警服務器的冗余機將產生報警信息并負責將報警信息傳送給客戶端,歷史記錄服務器的冗余機將存儲歷史數據并負責將歷史數據傳送給客戶端。當主機修復重新啟動后,從機檢測到了主機的恢復,會自動將主機丟失的歷史數據拷貝給主機,同時,將實時數據和報警緩沖區中的報警信息傳遞給主機,然后從機將重新處于監視狀態。這樣即使發生了事故,系統也能保存一個相對完整的數據庫以及報警信息和歷史數據等。
來源:環境監控系統 機房動力環境監控系統 http://www.1777000.com/solution/ 本文采集于網絡,如有問題有聯系刪除
北京金恒智能系統工程技術有限責任公司 版權所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.
法律聲明:未經許可,任何模仿本站模板、轉載本站內容等行為者,本站保留追究其法律責任的權利!
電話:86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號-2網站XML
智慧機房
在線體驗