2018年度工作總結
一、專案進度情況
1,生產資料庫到雙活資料庫的升級切換
7月11日凌晨,在恩墨的技術協助下完成了生產資料庫的升級切換。新的雙活生產資料庫效能大幅提升。自主重建的三節點備機叢集自8月份啟用後執行穩定,執行在open只讀狀態,以後可以用於報表等只讀查詢。該專案已於9月13日完成驗收。
目前我和邱銳正在參加每週末兩天的Oracle OCP遠端培訓,通過高強度的學習,我爭取在19年第一季度完成三門考試並取得認證,如果有機會希望明年能繼續參加OCM培訓,這對我來說也是一個挑戰。
2,空調維保購買
在中心兩個機房4臺空調維保7月底到期前,通過比價的方式,選定了日照本地的空調維保商。
3,3D動畫展示專案
目前該專案已經完成招標,正在和廠家簽訂合同,預計年底完成動畫視訊交付。
二、隱患和故障處理
1,舟道網APP介面、OA系統資料庫登入風暴
今年第一季度資料庫頻繁出現連線風暴隱患,資料庫每小時處理連線請求最高超過8萬次,導致部分應用系統執行卡頓。採取了舟道網APP介面服務切換到連線池、OA系統連線池引數優化、開發資料庫到RG01的讀寫分離等措施後效果顯著。現在資料庫連線請求低於每小時2萬次,請求量降低75%,資料庫連線風暴得到有效解除。
2,dblink session不主動釋放
一卡通、金蝶財務、交換資料庫都存在比較嚴重的dblink session不釋放的問題,一季度先後先後聯絡並配合內控開發公司、生產開發公司進行了整改,有效降低了RG01的session數,使RG01 session數保持在一個穩定的數量。
3,外包廠家線上刪除海量資料
上半年通過監控發現集發公司外包工程師VPN遠端進行千萬級資料量的刪除工作,sql執行時間超過30分鐘,redo日誌切換頻率高達每小時52次,給磁碟IO帶來非常大的壓力,嚴重影響資料庫的效能。
4,RG05日誌資料庫的建立
生產資料庫上存在APPLOG、無車承運人GPS歷史資訊歷史資料佔用空間較大的問題。通過分析,最終新建了RG05日誌資料庫,將APPLOG和無車承運人GPS資訊遷移過去。
5,生產資料庫伺服器記憶體板更換
10月10日上午,及時發現了一起生產資料庫伺服器宕機故障。故障原因為:伺服器記憶體板損壞。配件於11日下午17:25到貨,18:10自主完成更換。
6,生產資料庫伺服器主機板更換
10月16日生產資料庫第三節點伺服器(EDI機房,型號:SUN T5-2)宕機,無法啟動,經確認,伺服器主機板損壞。18日晚完成更換,生產資料庫恢復正常,至今執行穩定。
7,兩臺EMC VNX5300儲存硬碟連續損壞
今年8、9月份作為生產資料庫備機叢集使用兩臺EMC VNX5300儲存連續損壞十幾塊硬碟,這兩臺儲存已經使用超過6年的時間,硬碟集中損壞也是正常現象,已經分兩次採購了備用硬碟。
8,參與EDI機房漏雨應急處置
7月23日早上,EID機房和門廳出現牆體滲水、機房辦公室窗戶嚴重漏雨的情況。多次聯絡港灣施工方檢視現場,業務技術室給港灣發函後港灣進行了徹底檢查和整改。
9,參與EDI機房監控系統串列埠伺服器損壞應急處置
7月25日,機房動環監控系統串列埠伺服器損壞造成EDI機房通訊中斷。立即聯絡業務技術室採購一臺新的串列埠伺服器。27日裝置到貨後,順利恢復了串列埠伺服器,監控系統恢復正常。
三、資料庫監控與優化
1,協助完成對RG01生產庫優化許可權控制
協助邱銳完成對RG01許可權的控制,在技術手段上對非授權登入會話進行及時kill,可對其訪問生產環境資料庫進行限制。
2,sql優化
每月平均完成4-5條低效率的sql優化。
3,業務通知單釋出
每月定期釋出1-2個整改通知單。
4,資料庫擴容
通過監控,及時發現RG05、一卡通、金蝶等資料庫存在空間不足的隱患,都及時進行線上擴容。
四、明年的打算
1,雙活儲存擴容
針對目前雙活儲存空間不足的情況,希望明年能完成一次擴容,增加約60T的可用空間。
2,雙活資料庫優化
依託北京雲和恩墨的技術支援,不斷對雙活資料庫進行優化。3節點的備機可以作為只讀查詢使用,明年找個合適的專案進行嘗試。1節點的備機可以作為備份資料恢復測試使用,定期進行恢復測試。
3,能力培養
明年上半年我和邱銳先後取得OCP認證,如果有機會明年可以學習並考取OCM認證。打造一支實力較強的DBA團隊。