工程師單次服務案例

5月(yuè)19日,神行雲獸平台上突然接到這(zhè)樣一個(gè)需求:“業務的(de)數據庫交互的(de)下(xià)載速度慢(màn),發現有4個(gè)壞塊,急需要工程師排查故障并解決。設備信息:DB2數據庫。9.5版本運行系統環境windows2003  物(wù)理(lǐ)機X3950M2”。看到需求後,值班的(de)運營人(rén)員(yuán)馬上與客戶進行詳細的(de)溝通(tōng),與此同時(shí),将此工單推送給了(le)線上工程師。

 

也(yě)許是周六下(xià)午的(de)原因吧,平台遲遲沒有收到報名反饋……

 

于是,平台運營人(rén)員(yuán)開始在系統中搜索DB2标簽的(de)工程師,并與他(tā)們進行了(le)溝通(tōng),遺憾的(de)是,他(tā)們都無法按時(shí)前往客戶現場(chǎng)。

 

就在此時(shí),一位電話(huà)溝通(tōng)過的(de)DB2工程師主動給我們打來(lái)電話(huà),說他(tā)有朋友可(kě)以上門提供服務,并推薦朋友注冊成爲神行工程師。就這(zhè)樣,趙工首次以神行工程師的(de)身份,接到了(le)第一份工單。

 

終于找到合适的(de)工程師了(le),雖說過程有些複雜(zá),但這(zhè)也(yě)隻用(yòng)了(le)30分(fēn)鐘(zhōng),平台與趙工進行詳細溝通(tōng)。此時(shí)是下(xià)午4點30分(fēn),1小時(shí)後,趙工抵達客戶現場(chǎng)。

 

數據庫問題本就比較複雜(zá),又事關客戶業務,趙工絲毫不敢怠慢(màn),緊鑼密鼓開始排查。起先,趙工發現數據庫訪問速度降低,随即便做(zuò)了(le)優化(huà),趙工做(zuò)了(le)統計信息更新/大(dà)事務/性能差的(de)sql及應用(yòng)package的(de)綁定,應用(yòng)跑批“匹配和(hé)更新”環節,提升到由1000/每秒,提升到2000/每秒,但是數據“上載”性能仍未有提升,可(kě)以排除數據庫的(de)性能問題,但下(xià)載速度慢(màn)的(de)問題并未得(de)到解決,排查仍在繼續……

 

此時(shí)已是晚上11點,經過一再的(de)排查,最終可(kě)以排除數據庫性能問題,确定爲應用(yòng)服務器卡頓,趙工與客戶進行溝通(tōng),客戶協調硬件工程師配合處理(lǐ),經過6小時(shí)的(de)奮戰,趙工的(de)任務終于可(kě)以結束了(le),此時(shí)已是5月(yuè)20日淩晨,趙工離開前說道:“在處理(lǐ)應用(yòng)服務器時(shí),如果需要數據庫支持可(kě)以随時(shí)聯系我”。

 

5月(yuè)20日,我們對(duì)客戶進行電話(huà)回訪,客戶說,故障已經解決了(le),雖然最後确認不是DB2的(de)問題,但是工程師對(duì)數據庫做(zuò)了(le)全面檢查及優化(huà),表示對(duì)趙工的(de)專業态度及高(gāo)技能非常認可(kě)。對(duì)平台的(de)響應速度表示深切的(de)肯定。

 

這(zhè)次緊急工程師服務項目中,數據庫其實是沒有故障的(de),隻是性能出現了(le)問題,神行雲獸平台實際上是幫著(zhe)客戶做(zuò)了(le)一次數據庫的(de)優化(huà),這(zhè)是軟件類産品維保的(de)難點,和(hé)硬件類那種0和(hé)1的(de)故障相比,軟件的(de)問題更加模糊,與其他(tā)産品的(de)耦合關聯更多(duō),難度也(yě)更大(dà)。

 

此次問題的(de)順利解決主要得(de)益于神行雲獸平台廣泛的(de)工程師資源和(hé)秒級的(de)服務響應速度,接下(xià)來(lái)平台會進一步擴大(dà)工程師技能标簽,覆蓋更多(duō)服務場(chǎng)景。