云計算管理平臺是青云QingCloud 企業(yè)云平臺的管理、運維及運營系統(tǒng)(BOSS),v4.7 版本提供更加的豐富的運維與運營功能:
一、運維能力加強
1.1.資源池用量預測
運維能力加強的第一個功能點是“資源池用量預測”。
青云云平臺的安置組用于根據(jù)硬件類型劃分資源調(diào)度策略,根據(jù)不同類型的資源調(diào)度請求下發(fā)到不同安置組的計算節(jié)點,管理員可以根據(jù)實際資源池劃分需求,配置相應的安置組規(guī)則,但不同安置組之間不會觸發(fā)自動遷移;
目前不管是公有云,還是私有云,都需要有數(shù)據(jù)能夠幫助管理員規(guī)劃擴容;特別是私有云客戶,由于私有云客戶硬件采購周期很長,他們的運維人員非常需要知道各種資源擴容的啟動時間和擴容數(shù)量。
如上圖所示,為 “資源用量預測” 中的 “安置組用量預測”,在后續(xù)的規(guī)劃中將有更多的資源類型(例如EIP)會開放用量預測的功能。 在該功能中,預計可用時間剩余1~20 天的資源會用【紅色】警示, 預計可用時間超過20天但小于90天內(nèi)的資源用【橙色】提示。
對于每個安置組的用量預測,會使用到安置組內(nèi)各類資源的監(jiān)控數(shù)據(jù),通過該組監(jiān)控數(shù)據(jù),計算預測出一個“用量燃盡”數(shù)值。 由于監(jiān)控了該安置組內(nèi) CPU 、VCPU、物理內(nèi)存、虛擬內(nèi)存、物理硬盤、虛擬硬盤等多維度數(shù)據(jù), 當某個資源最先達到 “用量燃盡” 預警狀態(tài)時,該安置組就會處于 “用量燃盡” 預警狀態(tài)。
為了能讓客戶自由定義觸發(fā)擴容通知的資源用量閾值。 在用量預測中,提供了針對各種資源自定閾值的功能,當超過客戶設(shè)定的閾值時,就會觸發(fā)通知。同時,對于處于警告狀態(tài)下的安置組,也可以配置通知規(guī)則,將告警信息通知到指定的運維人員。
1.2.網(wǎng)絡連通性檢測
運維能力加強的第二個功能點是 “網(wǎng)絡連通性檢測”。
在青云云體系中,網(wǎng)絡狀態(tài)關(guān)乎平臺整體的可用性,而在部署青云云平臺時分為全局管理區(qū)(Global Zone)和由可用區(qū)(Zone)組成的區(qū)域(Region),在每個Zone內(nèi)還有青云核心管理節(jié)點KS(Kernel Service)。為了保障業(yè)務正常運行,我們需要監(jiān)控各 Zone 的 KS 節(jié)點與 Global 的網(wǎng)絡連通性與帶寬情況。
我們通過持續(xù)的 ping 命令檢測,并分析 ping 命令返回的結(jié)果(比如響應時間,是否丟包等),來評估鏈路之間的健康狀態(tài),進而評估網(wǎng)絡連通狀態(tài)。此外系統(tǒng)還可獲取交換機的監(jiān)控數(shù)據(jù),從而獲取一定時間內(nèi)的帶寬監(jiān)控數(shù)據(jù),輔助用戶評估網(wǎng)絡狀態(tài)。
1.3.配額修改功能增強
運維能力加強的第三個功能點是 “修改配額功能”。
隨著公司產(chǎn)品線的豐富,云用戶的 “配額信息” 中的可配置項也越來越多;為了方便運維人員快速找到所需的配額,我們在 “配額信息” 中新增了一個搜索功能,運維人員只需要搜索 “產(chǎn)品名稱” 或 “配置” 即可定位該配額所在欄目。
該搜索支持模糊匹配功能,即輸入關(guān)鍵詞即可出現(xiàn)和關(guān)鍵詞相關(guān)的所有條目,搜索到需要的條目后,會自動定位到該條目所在的欄目,并高亮顯示。
由于有些場景下,需要能 “批量” 對云用戶的配額進行修改,因此我們在云用戶列表頁,加入了 “批量修改配額” 功能,運維人員可以一次性選擇多個云用戶進行多項配額的修改,從而免去了挨個修改云用戶配額的繁復操作。
1.4.云用戶多區(qū)域資源數(shù)量統(tǒng)計
運維能力加強的最后一個功能點是,“云用戶多區(qū)域資源數(shù)量的統(tǒng)計” 功能。
隨著公司業(yè)務發(fā)展,我們的 Zone 會越來越多;而隨著客戶業(yè)務的發(fā)展,客戶在多個不同的 Zone 使用不同的業(yè)務資源成為常態(tài)。
為了方便運維人員快速查看該云用戶名下各類資源的總使用量,以及各類資源在各個 Zone 之間的分布情況,我們推出了云用戶多區(qū)域資源數(shù)量統(tǒng)計的功能。在該功能頁面中,無需頻繁切換 Zone,即可看到當前用戶在哪些區(qū)域有資源; 點擊區(qū)域即可跳轉(zhuǎn)至對應區(qū)域的資源列表,讓運維操作更加方便快捷。
二、運營能力加強
2.1.“搜一搜”全局搜索功能
青云QingCloud云計算管理平臺處于高速迭代開發(fā)中,各類管理功能也在快速增加;在該場景下,希求運營和運維的同事在使用平臺的過程中,完整的記住每個功能的位置,會變得不可行。
為了方便大家快速定位平臺中某個功能的位置,我們新加入了“搜一搜”全局搜索功能。 通過快捷鍵 (ctrl+k) 呼出搜索框;在這個搜索框中,可以搜索導航的名字, 也可以搜索資源ID,甚至可以搜索郵箱、手機號、公網(wǎng)IP地址等內(nèi)容。
2.2.通知組支持企業(yè)通訊工具
運營能力加強的第二個功能點是,通知組支持企業(yè)通訊工具。
在之前版本青云QingCloud云計算管理平臺的通知組中,支持的內(nèi)容為郵件、短信、Webhook 和 Syslog 等方式。而傳統(tǒng)的 Webhook 通知,要求客戶具有一定開發(fā)能力,能夠接收并處理我們指定格式的數(shù)據(jù); 而郵件通知的實時性不夠高,針對告警通知等場景,不能讓客戶運維團隊及時做出反應。
為了滿足實時性和通知接收端覆蓋面要求,使用大眾都在用的幾款辦公 & 即時通訊 APP 作為通知接受端,是一個很不錯的選擇。
因此我們首先支持了國內(nèi)用戶群體較多的幾款APP:企業(yè)微信、釘釘以及飛書。
這樣客戶就能夠在不安裝額外APP的情況下,及時收到各種告警以及通知了。
2.3.云平臺郵件服務器配置可視化
運營能力加強的第三個功能點是,云平臺郵件服務器支持可視化配置。
云平臺的通知郵件服務器用于發(fā)送內(nèi)部的告警通知郵件。 在以往,該服務器的發(fā)件郵箱的修改需通過修改配置文件完成,使用較為困難,且不方便進行測試。
因此,在本次發(fā)布的版本中增加了通過頁面配置服務通知郵箱的功能,免去了修改配置文件這樣高風險操作。 同時,該功能支持發(fā)送測試郵件,來驗證是否配置成功。
二、平臺等保策略加強
青云QingCloud云計算管理平臺在本次發(fā)版中增強了平臺自身的安全性,以滿足等保合規(guī)的一些要求。
- 支持對同賬戶同時登錄的數(shù)量進行限制;
- 支持配置賬戶不活動指定時間后退出登錄;
- 支持配置密碼過期時間,在過期前可自動發(fā)出郵件提醒;
- 支持對多次登錄失敗后對賬戶進行臨時鎖定;
- 支持開啟二次認證(雙因素認證),并支持對未開啟二次認證的用戶進行郵件提醒,在多次提醒后未開啟二次認證還可進行賬戶的自動禁用;
- 支持自動禁用長時間未登錄的用戶,免去離職賬戶的后顧之憂。