首页 » 博客 » 时序数据库在监控运维平台中的应用

时序数据库在监控运维平台中的应用

京城疫情突然来袭,我们都居家办公啦,但疫情挡不住开源项目的脚步,不知不觉中“局外Jesse论_Infra”专栏已经走过了2个多月,来到了第十一期。本期我们就继续来聊聊TSDB在监控运维平台中的应用。

本文仅代表个人观点,如有偏颇之处,还请海涵~

🤠🤠🤠

时序数据库在监控运维平台中的应用

 

现如今我们生活在一个信息化的世界,越来越多的数据被各种监控设备所自动采集。比如,监控摄像头、网络摄像机、环境监测设备、气象数据采集设备、水文数据采集设备等。这些监控设备将数据采集后通过网络实时上传,给我们的生活带来了极大的便利,同时也节省了大量的人力和物力。

监控数量猛增,运维迎挑战

然而伴随着监控设备数量的急速上升,在运行维护方面我们也遇到了新的压力和挑战。主要表现为:

(1)监控设备的维护和替换代价高,很多设备是在恶劣环境下使用,容易损坏。

(2)维护时间成本高。监控设备的分布非常零散,很多安装位置地点较为偏僻,这就造成了维护工作的强度提升,代价巨大。

(3)故障判断困难,无法精准维护。尤其是当监控设备处于离线状态时, 我们很难判断故障原因是供电故障还是网络故障。这就造成了大量原本只需要断电重启即可解决的故障,我们却花费了更大的代价去到现场解决。有鉴于以上三大问题,如何快速定为故障原因,进行远程故障排除,就成为了运维监控平台所急需解决的问题。

当前运维平台的不足

根据我们的观察,当前现有的运维管理平台存在着很大的问题和不足,主要有以下三点:

(1)监控运维平台可同时管理的监控设备数量有限,其性能急待提升。

(2)监控运维平台的安全性和可靠性不足,产品没有进行冗余设计。

(3)监控运维平台和前端数据采集设备兼容性不足,一些其他类型和其他厂家的监控设备,不能与之互通,也不能对已有设备进行升级。因此,面对如此多的问题,基于时序数据库的通用监控运维平台就成为了我们的必要选择。

基于时序数据库的监控运维平台

简要来讲,我们可以将监控运维平台,划分为三大部分。他们分别为:状态采集设备、运维管理平台以及运维可视化系统。

状态采集设备,主要负责采集各种监控设备的运行状态和信息,比如,电源、网络、传感器等。其一般会被安装在前端设备的监控箱内,并具有通用性、可扩展性、高可靠性和易维护性的特点。当状态采集设备采集到数据后,其会将数据信息发送给运维管理平台。

运维管理平台主要负责接收、存储、管理来自状态采集设备的运行数据。也正是在此环节,时序数据库将展现他的强大作用。由于监控设备的状态数据具有明显的时序数据特征,所以在使用传统的关系型数据库方面,在存储空间、写入和查询速度以及可靠性方面都无法满足需求。因此,我们可以采用时序数据库来存储大量带有时序特征的监控设备数据,而其他非时序特征的业务数据则继续用传统关系型数据库进行存储。

最后,我们将这些存储的数据搭建出一套可视化的运维平台系统,通过对监控运维数据的可视化渲染呈现,我们可以为企业的智能化运维提供必要的支持。

 

综上所述,基于时序数据库的监控运维平台解决了传统运维平台设备故障定位困难以及运维成本高的问题。其提供了一种更加智能、低廉、高效的解决方案,并能支持大量监控设备的运维管理工作。其已经展现了巨大的经济效益和市场潜力。

参与CnosDB社区交流群:

扫描下方二维码,加入CC进入CnosDB社区进入社区交流,CC也会在群内分享直播链接哒