技術中心
Technology conter工控機磁盤工作故障的防護與排除辦法
2015-05-25 10:26:02
一、 引言
隨著工業與計算機的快速發展,在自動化程度越來越高的今天,計算機也應用到自動化控制系統的方方面面。工業控制計算機(以下簡稱工控機)的安全也顯得尤為重要。工控機與普通計算機的技術原理相同,組成結構也差不多,只是在工控機強調的是其工作穩定性。工控機一般工作在相對惡劣的環境下工作的,對環境溫度、濕度、供及電壓、平穩性、通風性能等要求比較高,但工作環境往往達不到要求,工控機也容易發生故障,部分硬件出現問題還能及時更換,一旦磁盤發生損壞,會造成大量記錄數據丟失,控制軟件破壞,短時間無法修復,造成被控參數控制不穩,往往帶來巨大的經濟損失。
二、 故障現象描述
工控機長時間運行后,(長時間指:包括連續工作一個標準月30天24小時工作制及以上的時間),機箱內積集大量灰塵,機箱溫度較高。通常在不關機的情況下一切工作正常,一旦因電力供應不足或需要緊急停機時,控制系統容易出現磁盤無法啟動、系統無法加載、長時間處于登陸畫面等故障。以山東玻璃集團廊坊高新玻璃生產線的10臺操作員站和4臺工程師站為例:
系統配置
工 控 機:研華工控機、DELL GX270
操作系統:Windows 2000 Professional Windows 98(一臺)(正版)
控制軟件:Citect、Freelance 2000、WCC5.0、SETP7 5.2等正版軟件
輔助軟件:WINRAR 3.0、Windows 2000 Professional SP4補丁等
工作時間:全年全日制工作(365天24小時)
工作環境:環境溫度利用空調控制在10攝氏度到30攝氏度之間、地面有輕微機械震感、空氣有可吸入顆粒物。
空氣濕度:5%~50%RH
自2003年12月運行以來,共有三臺計算機累計五次出現磁盤錯誤導致無法啟動的故障。筆者與微軟操作系統服務部聯系至今也沒有得到可靠回復。
三、 故障分析及排除方法
引起磁盤故障的原因非常多,我們在這里大概的分為磁盤本身的質量問題和工作環境引起的故障問題。
磁盤本身的質量問題,我們無法深入考究,只有在開始做控制系統時,選擇購買質量、品牌較好硬盤,也可以利用Scandisk、Norton Disk Doctor等軟件進行磁盤表面缺陷檢測。假如我們能夠預知硬盤的質量和健康狀態,這將為我們選擇硬盤和備份重要數據贏得時間。筆者在網上發現一款名為Drive Health軟件,可以檢測硬盤的使用壽命,可以幫助大家提前得知硬盤健康狀態。
工作環境引起的故障問題,常見的有下面幾個方面:
1、 工控機工作時間長。
由于正常生產的需要,部分工廠的工業控制系統需要長時間工作,給工控機操作系統帶來巨大考驗。據微軟的操作系統運行時間報告中表明,微軟聲稱其Windows 2000后的操作系統可以支持長時間工作,但從實際運行看,運行時間超過一周后,磁盤在龐大數據交換過程中,會積累大量的數據碎片,容易造成磁盤邏輯壞道、讀寫錯誤及系統運行和啟動變慢。所以工控機在生產允許的情況下,可定時進行重啟工控機和磁盤碎片整理,以減少因長時間工作導致的磁盤錯誤。重啟時間可按工控機處理數據量的大小和生產情況而定,它不是硬性的,需要讀者慢慢摸索。從筆者的實際經驗來看,一個標準月(30天)重啟和整理一次工控機可以減少磁盤錯誤的機率。
2、 工控機內部溫度過高。
在需長時間高溫運行的環境中,計算機各元件極易發生老化、硬盤故障的頻率也較之升高。這就需要工廠的自動化系統維護人員在日常巡檢中,密切關注機箱溫度,盡量使工控機的溫度保持在10--30攝氏度之間,過高、過低的溫度都不適宜硬盤的保護,如果機箱溫度達到30攝氏度,內部硬盤的溫度會達到40度或更高。我們可以簡單DIR一下自己的工控機,以達到降低環境溫度的作用。一、更換大功率CPU、硬盤風扇(硬盤風扇要注意固定,不宜安裝在硬盤固件架上,以防因風扇轉動帶來硬盤震動)加快散熱;二、在機箱內部加裝向機箱外抽風的風扇,增加空氣對流;三、在放置工控機的機柜上,安裝小型軸流風機;四、在控制室加裝空調,以降低空間溫度。
3、 環境濕度不適宜。
工控機主要是由眾多電子元件的集成電路構成,其絕緣性能跟環境濕度有很大關系。濕度過大,容易造成電路板短路而燒毀;濕度過小,容易產生靜電,也會擊穿部分電子元件。因此,濕度過大、過小,都會給工控機帶來潛在的威脅。靜電防護問題上要求我們工控機上必須要有良好的儀表接地。值得說明的是,工控機接地極不同與土建上的防雷接地,接地極選址應距控制室處三米遠,在室外的地坪下1700mm處用∮20鍍鋅角鋼作垂直接地極,接地數量滿足接地電阻小于1歐姆(回填時應用搖表測試),再采用40404鍍鋅扁鋼與接地體可靠焊接(每個焊接點還要做仔細的防銹處理),分至建筑物內換接25mm銅電纜至系統地端子和工控機接地點。這樣可以有效的減少靜電帶來的危害。
4、 地面震感大。
很多工廠生產中需要電機產生拖動、震動等物理性位移動作,不僅帶來巨大的噪音,機器工作時帶來的震動會給工控機磁盤、光驅、軟驅帶來巨大的損害。磁盤生產的工藝越來越高,現行轉速已達到7200轉每秒乃至更高。在自動化控制系統中的大量數據交換中,長時間、高速度運轉的磁盤,容易因磁盤震動,導致磁盤讀寫能力下降,磁頭定位緩慢,甚至造成磁盤損壞;因此減少工控機環境震感,有利于保護磁盤。我們可以在工程設計時,盡可能的讓工控機遠離震源大的工作現場;如果工作地點無法更改,我們還可以在工控機柜、箱體下墊置海綿、可緩沖性物體以減小震動帶來的危害。
5、 空氣中的可吸入顆粒物多。
很多工廠的原料大多需要粉料進行加工,加上外界空氣流動大、沙塵多,工控機內容易集積大量粘糊狀積塵,造成工控機內局部溫度過高,帶來硬件損壞。這種情況多發于CPU、電源、硬盤、顯卡等散熱風扇周圍。積塵較輕的地方,在正常生產允許的情況下,可以采用定時吹塵。積塵較嚴重的地方,可以工控機箱透風處安置濾塵紗布,定期清理。
6、 供電電壓波動大、易停電。
工業和生活快速的發展,對電的需求量也日益增大,很多地區有電力供應不足、電壓不穩、易停電的情況發生。電壓不穩和突然停電,造成系統頻繁重啟,系統文件也容易因此發生丟失而無法正常啟動;正在執行讀寫動作的磁頭,有時會因為停電造成磁頭回位不準帶來工控機磁盤故障。因此工控機工作環境電源的穩定關系到工控機工作正常與否。我們可以采用穩壓電源和UPS不間斷電源進行保護,具體設備選型,要依負載功率大小、需保持工作時間多少來定。
四、 故障救急策略
很多時候,我們的工控人員做了很多保護工作,仍然有工控機磁盤發生故障的情況,下面我們就與讀者探討一下如何在發生故障前采取補救措施。建議讀者先學會使用GHOST(著名的磁盤克隆軟件)軟件,對象版本盡可能最新,這將有助于下列方案的實施。
無需資金投入方案:GHOST克隆鏡像
方案前提:僅僅系統盤出現故障,系統盤可以被FORMAT軟件正常格式化。(筆者曾遇到兩次無法正常用FORMAT軟件格式化系統盤,主從盤方式下,訪問壞磁盤的系統盤時,提示參數錯誤,采用低格后恢復)
方案材料:GHOST軟件、DOS系統引導盤(可光盤、軟件、U盤)
方案實施:磁盤故障大多發生在系統盤(C盤),在自動化系統正式投入運行后,首先利用GHOST軟件,對系統盤進行鏡像,將鏡像文件(.GHO)放至FAT32磁盤格式下進行備份(因為單磁盤情況下,對系統盤進行GHOST恢復,一般在DOS下進行,DOS只能運行在FAT32、FAT16等磁盤格式下,在NTFS的分盤格式下是不能被運行的。),一旦系統盤發生故障,最快的方法可將系統盤格式化掉,利用GHOST軟件可在5分鐘左右將原鏡像好的文件恢復到系統盤。
方案結論:無需設備投入,無需資金花銷;恢復速度快。此方案只能針對于操作系統破壞而非磁盤發生物理性損壞的情況下采用;一旦磁盤物理損壞,此方案將無法進行。這也可推廣至整個磁盤鏡像。
經濟型方案:克隆雙硬盤備份+GHOST鏡像
方案前提:工控機磁盤故障(無論是系統故障還是磁盤物理性損壞)
方案材料:目標工控機內同型號磁盤一塊、GHOST軟件、DOS系統引導盤(可光盤、軟件、USB盤)
方案實施:在工控機系統投入運行之前,利用GHOST軟件先將存有控制系統磁盤的系統盤(C盤)鏡像至該磁盤的非系統盤FAT32磁盤格式分區下,再將其整個硬盤內容完整克隆至同型號備用磁盤內。一旦出現操作系統損壞,可將操作系統鏡像文件恢復;如果發生整個磁盤故障,可將壞磁盤拆除,換上先向備份好同樣內容的備用硬盤即可。
方案結論:只需投入一塊磁盤的資金(約400-800元人民幣之間,視磁盤大小、廠商的不同)、更換容易、恢復速度快、可排除所有磁盤問題。
安全性投入方案(經濟型):采用Windows 2000雙硬盤RAID1或三硬盤RAID5方式的軟件磁盤陣列
方案前提:此方案的實施時間,最好在工控機投入運行之前
方案材料:Windows 2000系統盤或更高版本、磁盤兩塊(型號相同為宜)
方案實施:首先安裝Windows 2000系統或更高版本(因為微軟在Windows NT后對磁盤陣列比較好),啟動磁盤陣列功能支持。磁盤陣列方式能在工控機運行時的寫操作,同時向兩塊磁盤寫入相同的內容,假如兩塊磁盤有一塊發生故障時,另一塊磁盤因為是同時寫入的相同內容,能無擾的切換正常工作狀態。也就是說,磁盤陣列方式下的兩塊硬盤中只要有一塊磁盤沒有損壞,重要數據就不會丟失。事后可再更換或維修壞磁盤,最大好處就是不會影響到生產數據的丟失,更換速度也很快。
方案結論:投入較小,安全性高,穩定性跟系統安裝設置好壞有關、但技術初學者不易掌握。
安全性投入方案(穩定型):采用低端服務器硬件磁盤陣列方式(面對技術要求低、穩定生產高、數據相當重要的地方使用)
方案材料:支持硬件磁盤陣列功能的低端服務器一臺約2萬5千元人民幣左右
方案實施:因為是采用硬件方式的磁盤陣列,所有外界對其干擾低,故障發生率低。在發生磁盤故障時,只需對壞硬盤進行拆除,補充相同型號新硬盤即可。具體實施辦法,詳情請咨詢低端服務器提供商。
方案結論:投入相對較大、安全性高、穩定性好、技術要求低。
五、 結束語
工控機磁盤故障帶來的危害不言而喻,保證它的安全是我們工控人員應該關注的問題,只有我們事先做好詳細的防護措施,工控機才能穩定、高效的運行。筆者在實際工作采用上述辦法,有效避免了工控機磁盤故障,能將故障的修復時間由原來的幾個小時,縮短為幾分鐘,為正常生產提供保障。