當前位置:經(jīng)典案例

運行維護

發(fā)布日期:2019/3/31 18:18:18 訪問次數(shù):5216

**運維項目實施方案

一、方案概述

***電子政務內(nèi)網(wǎng)(涉密網(wǎng))、電子政務外網(wǎng)(互聯(lián)網(wǎng)+CA認證)、內(nèi)部局域網(wǎng)(檔案、辦公應用)、業(yè)務專網(wǎng)接入(防洪指揮視頻會議、財政國庫支付、山洪災害系統(tǒng)、小水庫水雨監(jiān)測系統(tǒng))等項目建設完成后,需建立統(tǒng)一的運行維護機制和專門的運行維護團隊,包括對中心機房、網(wǎng)絡、主機設備、存儲設備、操作系統(tǒng)、數(shù)據(jù)庫、支撐軟件平臺和業(yè)務應用平臺等內(nèi)容進行運行維護服務,保證用戶現(xiàn)有的信息系統(tǒng)正常運行,降低整體運行管理成本,提高網(wǎng)絡信息系統(tǒng)的整體服務水平。同時根據(jù)日常維護的數(shù)據(jù)和記錄,提供用戶信息系統(tǒng)的整體建設規(guī)劃和建議,更好的為用戶的信息化發(fā)展提供有力的保障。

隨著科學技術和網(wǎng)絡信息化的發(fā)展,人們對辦公自動化的依賴程度和期望越來越高。各種設備、網(wǎng)絡、業(yè)務應用平臺的運行維護的任務不斷增加,目前貴單位負責此項工作的只有1人,遠遠不能滿足辦公設備修復和快速響應的需求。需要通過購買社會運行維護外包服務,提高行政效率,更好的為水利事業(yè)發(fā)展提供保障。

技術實施方案,由十堰市高升工貿(mào)有限公司(涉密信息系統(tǒng)集成資質(zhì)企業(yè)、十堰市政府采購協(xié)議供應商、原單位信息化承建商)負責網(wǎng)絡運行維護服務,提供1-3名網(wǎng)絡技術專業(yè)人員提供不駐場服務,由負責項目總體運行維護服務單位統(tǒng)籌調(diào)度,及時響應保障。 整體運行維護服務框架如下圖所示


二、服務內(nèi)容

通過運行錐護服務的有效管理來提升用戶信息系統(tǒng)的服務效率,協(xié)調(diào)各業(yè)務應用系統(tǒng)的內(nèi)部運作,改善網(wǎng)絡信息系統(tǒng)部門與業(yè)務部門的溝通,提高服務質(zhì)量。

結(jié)合用戶現(xiàn)有的環(huán)境、組織結(jié)構(gòu)、IT資源和管理流程的特點,從流程、人員和技術三方面來規(guī)劃用戶的網(wǎng)絡信息系統(tǒng)結(jié)構(gòu)。

將用戶的運行目標、業(yè)務需求與IT服務相協(xié)調(diào)一致。

信息系統(tǒng)服務的目標是,對用戶現(xiàn)有的信息系統(tǒng)基礎資源進行監(jiān)控和管理,及時掌握網(wǎng)絡信息系統(tǒng)資源現(xiàn)狀和配置信息,反映信息系統(tǒng)資源的可用性情況和健康狀況,創(chuàng)建一個可知可控的IT環(huán)境,從而保證用戶信息系統(tǒng)的各類業(yè)務應用系統(tǒng)的可靠、高效、持續(xù)、安全運行

服務項目范圍覆蓋的信息系統(tǒng)資源以下方面的關鍵狀態(tài)及參數(shù)指標:

運行狀態(tài)、故障情況;  

配置信息 ;

可用性情況及健康狀況性能指標。

(一)信息資產(chǎn)統(tǒng)計服務

此項服務為基本服務,包含在運行維護服務中,幫助我們對用戶現(xiàn)有的信息資產(chǎn)情況進行了解,更好的提供系統(tǒng)的運行維護服務。

服務內(nèi)容包括:

硬件設備型號、數(shù)量、版本等信息統(tǒng)計記錄;

軟件產(chǎn)品型號、版本和補丁等信息統(tǒng)計記錄;

網(wǎng)絡結(jié)構(gòu)、網(wǎng)絡路由、網(wǎng)絡IP地址統(tǒng)計記錄;

綜合布線系統(tǒng)結(jié)構(gòu)圖的繪制。

(二)網(wǎng)絡、安全系統(tǒng)運維服務

十堰市水利水電局現(xiàn)階段網(wǎng)絡的連通性、網(wǎng)絡的性能、網(wǎng)絡的監(jiān)控管理、涉密程度管控等四個方面實現(xiàn)對網(wǎng)絡系統(tǒng)的運維管理。

網(wǎng)絡、安全系統(tǒng)基本服務內(nèi)容:

序號

服務模塊

內(nèi)容描述

1

現(xiàn)場備件安裝

配合用戶進行,按備件到達現(xiàn)場時間工程師到達現(xiàn)場

2

現(xiàn)場軟件升級

分析軟件升級的必要性和風險,配合用戶進行軟件升級

3

現(xiàn)場故障診斷

按服務級別:7×24小時或 5×8小時

4

電話遠程技術支持

7×24小時

5

駐場服務

5×8小時

6

問題管理系統(tǒng)

對遇到的問題進行匯總和發(fā)布

(1)駐場技術服務

根據(jù)用戶的需求提供長期的用戶現(xiàn)場技術人員值守服務,保證網(wǎng)絡的實時連通和可用,保障接入交換機、匯聚交換機和核心交換機的正常運轉(zhuǎn)。

現(xiàn)場值守的技術人員每天記錄網(wǎng)絡交換機的端口是否可以正常使用,網(wǎng)絡的轉(zhuǎn)發(fā)和路由是否正常進行,交換機的性能檢測,進行整體網(wǎng)絡性能評估,針對網(wǎng)絡的利用率進行優(yōu)化并提出網(wǎng)絡擴容和優(yōu)化的建議。

現(xiàn)場人員還進行安全設備的日常運行狀態(tài)的監(jiān)控,對各種安全設備的日志檢查,對重點事件進行記錄,對安全事件的產(chǎn)生原因進行判斷和解決,及時發(fā)現(xiàn)問題,防患于未然。同時能夠?qū)υO備的運行數(shù)據(jù)進行記錄,形成報表進行統(tǒng)計分析,便于進行網(wǎng)絡系統(tǒng)的分析和故障的提前預知。

具體記錄的數(shù)據(jù)包括

配置數(shù)據(jù)

性能數(shù)據(jù)

故障數(shù)據(jù)

(2)現(xiàn)場巡檢服務

現(xiàn)場巡檢服務是公司對客戶的設備及網(wǎng)絡進行全面檢查的服務項目,通過該服務可使客戶獲得設備運行的第一手資料,最大可能地發(fā)現(xiàn)存在的隱患,保障設備穩(wěn)定運行。同時,公司將有針對性地提出預警及解決建議,使客戶能夠提早預防,最大限度降低運營風險

(3)網(wǎng)絡運行分析與管理服

網(wǎng)絡運行分析與管理服是指工程師通過對網(wǎng)絡運行狀況、網(wǎng)絡問題進行周期性檢查、分析后,為客戶提出指導性建議的一種綜合性高級服務,其內(nèi)容包括:

服務內(nèi)容

服務優(yōu)點

向客戶提供網(wǎng)絡專家號碼

保證重大問題第一連線至網(wǎng)絡專家

網(wǎng)絡專家組每周與客戶進行不少于2小時的電話技術交流

以最小成本保證及時解答客戶關心的技術問題,并就某一領域技術問題展開深層次溝通。

每月向客戶提交CASE匯總分析報告,可擴展到每年17次(月度、季度、年度)

使客戶了解網(wǎng)絡歷史故障情況以及故障預防建議,最大程度減少網(wǎng)絡故障隱患,更高效的進行網(wǎng)絡管理。

(4)重要時刻專人值守服務

保證重要時刻設備穩(wěn)定運行對客戶成功尤為關鍵,因此,對客戶提供重要時刻的專人現(xiàn)場值守支持,包括重大會議期間、重大應急突發(fā)事件期間、辦公業(yè)務網(wǎng)重大割接或其它任何客戶認為可能對其業(yè)務運營產(chǎn)生重大影響的時刻,如需專人值守,按事先合同約定提供專人值守服務。

()主機、存儲系統(tǒng)運維服務

主機、存儲系統(tǒng)的運維服務包括:主機、存儲設備的日常監(jiān)控,設備的運行狀態(tài)監(jiān)控,故障處理,操作系統(tǒng)維護,補丁升級等內(nèi)容。

主機存儲系統(tǒng)基本服務內(nèi)容:

序號

服務模塊

內(nèi)容描述

1

現(xiàn)場備件安裝

配合用戶進行。按備件到達現(xiàn)場時間工程師到達現(xiàn)場

2

補丁服務

消除軟件漏洞給系統(tǒng)帶來的安全隱患,并對安裝補丁所引起的系統(tǒng)連鎖反應進行合理的平衡。

3

升級服務

對系統(tǒng)進行軟件或硬件的升級,以改進、完善現(xiàn)有系統(tǒng)或消除現(xiàn)有系統(tǒng)的漏洞。

4

現(xiàn)場故障診斷

按服務級別:7×24小時5×8小時

5

電話遠程技術支持

7×24小時

6

問題管理系統(tǒng)

對遇到的問題進行匯總和發(fā)布

7

系統(tǒng)優(yōu)化

對客戶系統(tǒng)括主機、存儲設備、操作系統(tǒng)、提供優(yōu)化服務

現(xiàn)場值守人員可進行監(jiān)控管理的內(nèi)容包括:

●CPU性能管理

內(nèi)存使用情況管理

硬盤利用情況管理

系統(tǒng)進程管理

主機性能管理

實時監(jiān)控主機電源、風扇的使用情況及主機機箱內(nèi)部溫度

監(jiān)控主機硬盤運行狀態(tài)

監(jiān)控主機網(wǎng)卡、陣列卡等硬件狀態(tài)

●監(jiān)控主機HA運行狀況

主機系統(tǒng)文件系統(tǒng)管理

監(jiān)控存儲交換機設備狀態(tài)、端口狀態(tài)、傳輸速度

監(jiān)控服務進程、硬盤空間,CPU等 

對存儲的性能(如高速緩存、光纖通道等)進行檢查

(四)數(shù)據(jù)庫系統(tǒng)運維服務

數(shù)據(jù)庫運行維護服務是包括主動數(shù)據(jù)庫性能管理,數(shù)據(jù)庫的主動性能管理對系統(tǒng)運維非常重要。通過主動式性能管理可了解數(shù)據(jù)庫的日常運行狀態(tài),識別數(shù)據(jù)庫的性能問題發(fā)生在什么地方,有針對性地進行性能優(yōu)化。同時,密切注意數(shù)據(jù)庫系統(tǒng)的變化,主動地預防可能發(fā)生的問題。

數(shù)據(jù)庫運行維護服務還包括快速發(fā)現(xiàn)、診斷和解決性能,在出現(xiàn)問題時,及時找出性能瓶頸,解決數(shù)據(jù)庫性能問題,維護高效的應用系統(tǒng)。

數(shù)據(jù)庫運行維護服務,主要工作是使用技術手段來達到管理的目標,以系統(tǒng)最終的運行維護為目標,提高用戶的工作效率。

具體數(shù)據(jù)庫運行維護監(jiān)控的基本服務內(nèi)容包括

序號

服務模塊

內(nèi)容描述

1

數(shù)據(jù)庫7*24電話支持服務

每周7天,每天24小時支持中心電話,電子郵件答詢,以滿足業(yè)務發(fā)展的需要;數(shù)據(jù)庫產(chǎn)品技術專家直接同客戶對話,幫助解決客戶提出的疑難問題;根據(jù)問題的嚴重程度,將優(yōu)先解決客戶認為是關鍵而緊急的任務;對客戶提出的一般性問題進行技術咨詢、指導;定期的客戶管理報告,避免問題再度發(fā)生。

2

數(shù)據(jù)庫產(chǎn)品現(xiàn)場服務響應

數(shù)據(jù)庫宕機/數(shù)據(jù)壞塊/影響業(yè)務不能進行的產(chǎn)品問題/軟件產(chǎn)品的更新及維護

3

數(shù)據(jù)庫產(chǎn)品系統(tǒng)健康檢查

對系統(tǒng)的配置及運作框架提出建議,以幫助您得到一個更堅強可靠的運作環(huán)境;降低系統(tǒng)潛在的風險,包括數(shù)據(jù)丟失、安全漏洞系統(tǒng)崩潰、性能降低及資源緊張;檢查并分析系統(tǒng)日志及跟蹤文件,發(fā)現(xiàn)并排除數(shù)據(jù)庫系統(tǒng)錯誤隱患;檢查數(shù)據(jù)庫系統(tǒng)是否需要應用最新的補丁集:檢查數(shù)據(jù)庫空間的使用情況;協(xié)助進行數(shù)據(jù)庫空的規(guī)劃管理;檢查數(shù)據(jù)庫備份的完整性;監(jiān)控數(shù)據(jù)庫性能;確認系統(tǒng)的資源;明確您系統(tǒng)的能力及不足;通過改善系統(tǒng)環(huán)境的穩(wěn)定性來降低潛在的系統(tǒng)宕機時間。

4

數(shù)據(jù)庫產(chǎn)品性能調(diào)優(yōu)

分析用戶的應用類型和用戶行為;評價并修改數(shù)據(jù)庫的參數(shù)設置;評價并調(diào)整數(shù)據(jù)庫的數(shù)據(jù)分布;評價應用對硬件和系統(tǒng)的使用情況,并提出建議;利用先進的性能調(diào)整工具實施數(shù)據(jù)庫的性能調(diào)整;培訓用戶有關性能調(diào)整的概念;提供用戶完整的性能調(diào)整報告和解決方法。

(五)支撐軟件和應用系統(tǒng)維護

保證系統(tǒng)正常而可靠地運行,并能使系統(tǒng)不斷得到改善和提高,以充分發(fā)揮作用。因此,要有計劃、有組織地對系統(tǒng)進行必要的改動,以保證系統(tǒng)中的各個要素隨著用戶需求、環(huán)境等的變化始終處于最新的、正確的工作態(tài)。

系統(tǒng)應用程序維護。

根據(jù)用戶需求進行系統(tǒng)業(yè)務邏輯調(diào)整。即對系統(tǒng)程序的修改和調(diào)整,擴充在使用過程中用戶提出的新的功能及性能要求,數(shù)據(jù)維護。

業(yè)務處理對數(shù)據(jù)的需求是不斷發(fā)生變化的,除了系統(tǒng)中主體業(yè)務數(shù)據(jù)的定期正常更新外,還有許多數(shù)據(jù)需要進行不定期的更新,或隨環(huán)境或業(yè)務的變化而進行調(diào)整,以及數(shù)據(jù)內(nèi)容的增加、數(shù)據(jù)結(jié)構(gòu)的調(diào)整。此外,數(shù)據(jù)的備份與恢復等,都是數(shù)據(jù)維護的工作內(nèi)容。

代碼維護。

隨著系統(tǒng)應用范圍的擴大,應用環(huán)境的變化,系統(tǒng)中的各種代碼都需要進行一定程度的增加、修改、刪除,以及設置新的代碼,定期檢查程序錯誤日志,清除系統(tǒng)運行中發(fā)生的故障和錯誤。

三、工作職責

(一)總體要求

(1)維護目的

保障設備正常運行,通對支撐系統(tǒng)、監(jiān)控設備、計算機主機設備定期檢測、維護和保養(yǎng),保障機房設備運行穩(wěn)定,通過保養(yǎng)延長設備生命周期,降低故障率,確保機房在突發(fā)事故導致硬件設備故障,影響機房正常運作情況下,可及時得到設備供應商或機房服務維護人員的產(chǎn)品維修和技術支持,并快速解決故障。

(2)維護內(nèi)容

機房主機設備維護管理:計算機服務器(包括PC服務器及存儲服務器);網(wǎng)絡設備(交換設備等);

機房監(jiān)控設備維護管理:供配電監(jiān)測系統(tǒng)、溫度環(huán)境檢測系統(tǒng)、門禁設備系統(tǒng)、保安監(jiān)控設備

機房空調(diào)與配電設備維護管理:空調(diào)設備,新風設備,UPS電池,主配電箱;

機房消防設備維護管理:煙感熱感探測器,手動報警按鈕和報警控制器、滅火器的控制裝置;

機房供水水路、電路及照明維護管理:水電路管線及接口的檢查維護;

機房基礎維護管理:機柜線路的整理、標簽檢查更換,機房除塵清潔、防火地板、墻面、吊頂,門窗及相關配套的維護管理。

(二)設備維護

機器部件的清洗,設備故降的檢修,易損部件的更換等,這些工作都應由專人負責,定期進行,以保證系統(tǒng)正常有效地工作

1、機房除塵及環(huán)境要求

定期對設備進行除塵處理,清理,調(diào)整安保攝像頭清晰度,防止由于機器運轉(zhuǎn)、靜電等因素將塵土吸入監(jiān)控設備內(nèi)部。同時檢查機房通風、散熱、凈塵、供電等設施。機房室內(nèi)溫度應控制在+5℃+35℃,相對濕度應控制在10%-80%。

2、機房空調(diào)及新風維護

檢查空調(diào)運行是否正常,換風設備運轉(zhuǎn)是否正常。從觀察制冷劑液面,看是否缺少制冷劑,檢查空調(diào)壓縮機高、低壓保護開關干燥過濾器及其他附件。

3、UPS及電池維護

根據(jù)實際情況進行電池核對性容量測試;進行電池組充放電維護及調(diào)整充電電流,確保電池組正常工作;檢查記錄輸出波形、諧波含量、零地電壓;查清各參數(shù)是否配置正確;定期進行UPS功能測試,如UPS同市電的切換實驗。

4、消防設備維護

檢查火警探測器、手動報警按鈕、火災警報裝置外觀及試驗報警功能;檢查火災警報控制器的自檢、消音、復位功能及主備用電源切換功能。

5、電路及照明電路維護

鎮(zhèn)流器、燈管及時更新,開關更換;線頭氧化處理,標簽巡查更換供電線路緣檢查,防止意外短路。

6、機房基礎維護

靜電地板清洗清潔,地面除塵:縫隙調(diào)整,損壞更換:接地電阻測試;主接地點除銹,接頭緊固;防雷器檢查;接地線觸點防氧化加固。

7、機房運維管理體系

完善機房運維規(guī)范,優(yōu)化機房運維管理體系。維護人員24小時及時響應。

(三)安全系統(tǒng)維護

保證網(wǎng)絡的穩(wěn)定、安全,是系統(tǒng)正常高效的運行。

系統(tǒng)需要的主機數(shù)目較多,各類硬件可能出現(xiàn)問題,包括路由器、交換機、網(wǎng)絡服務器、數(shù)據(jù)庫服務器等,都需定期保養(yǎng)和提供相應配件。

定期對系統(tǒng)進行安全漏洞掃描,安裝更新補丁

防毒軟件、防火墻等也要定期進行更新補丁,并且要保證病毒庫是最新的,還要定期的進行病毒掃描、木馬查殺等工作。

定期將交換機、防火墻、網(wǎng)絡服務器主機、數(shù)據(jù)庫服務器等各項指標信息收集集中,以報表形式呈現(xiàn),以及早發(fā)現(xiàn)問題。

定期測算系統(tǒng)網(wǎng)絡速度、數(shù)據(jù)流量,提前做好服務器擴容等準備工作,以滿足訪問量、流量逐漸增大的需求。



上一案例:系統(tǒng)集成

下一案例:服務外包

工作時間

早8:30 - 晚17:30

周六日休息