

背景
每个企业都意识到监控工作的重要性,但80%企业的监控工作仍然处在监控的初级阶段,尚未采用有效的监控运维系统。那么,什么是初级阶段呢?大概是指被动监控、人肉监控、人肉测试、服务器只能靠重启的传统运维模式。
1.被动监控,故障发生运维人员永远不是第一个发现故障的人;
2.监控IP地址与TCP端口,很多时候HTTP 80端口正常接受请求,但WEB服务器不能正常工作。
3.人肉监控(人肉运维),采用人海战术,桌面摆放很多显示器,甚至投影仪,要求监控者盯着各种仪表板界面,制定各种工作流程以及KPI考核监控人员。
4.人肉测试,要求监控人员每间隔几分钟人工操作一次,以确认系统正常工作;
5.万能的重启,定其重启所有的服务器。
关于监控运维系统
监控运维系统的目标:
监控的价值在于帮助企业在业务层面提供更多运维保障,进而帮助企业业务连续运转,主要监控的目标包含四种:
监控运维的常用方法:
传统监控常用方法如下:
监控流程
以Zabbix为例,来了解整个监控流程:
Step 1:数据采集:通过SNMP、Agent、ICMP、SSH等对系统进行数据采集;
Step2:数据存储:存储在MySQL上,也可以存储在其他数据库服务;
Step3:数据分析:当我们事后需要复盘分析故障时,也可存储在其他数据库服务;
Step4:数据展示:Web界面展示
Step5:监控报警:电话报警、邮件报警、微信报警、短信报警等
Step6:报警处理:当接收到报警,根据保障的级别进行处理。
监控指标
同样以Zabbix为例,监控运维系统到底都在监控哪些维度的信息?
1.监控硬件:
可监控硬件,包括CPU温度、物理磁盘、虚拟磁盘、主板温度、磁盘阵列等,zabbix提供IPMI监控模板,Zabbix IPMI Interface 系统自带的IPMI模板只能监控风扇、电源和部分温度。
2.监控系统:
中小型企业基本都是Linux服务器,所以系统监控是基础,主要监控对象包括:
(1)CPU
CPU整体使用百分比;
用户态使用百分比;内核态使用百分比;每个CPU使用情况
(2)磁盘
磁盘读写吞吐;磁盘读写次数
(3)内存
内存使用量;内存剩余量
(4)网络
网卡出入带宽;网卡出入包量;TCP状态监控;进程端口监控
(5)进程
3.监控应用:
应用服务监控也是监控体系中比较重要的内容,如LVS、Haproxy、Docker、Nginx、PHP、MySQL等等,相关服务都需要被监控起来。
4.监控网络:
网络监控是构建监控平台必须考虑的,尤其是针对多个机房的场景,各个机房之间的网络状态,机房和全国各地的网络状态都是需要监控的对象。
5.监控日志:
通常情况下,随着系统的运行,操作系统会产生系统日志,应用程序会产生应用程序的访问日志、错误日志、运行日志、网络日志,可以使用ELK来进行日志监控,对于日志监控来说,最常见的需求是收集、存储、查询、展示。
6.监控API:
由于API变得越来越重要,很显然我们也需要这样的数据来分辨我们提供的API是否能够正常运作。监控API接口GET、POST、PUT、DELETE等等的请求,以可用性、正确性、响应时间为三大重要性能指标。
7.监控性能:
全面监控网页性能,DNS响应时间、HTTP建立连接时间、页面性能指数、响应时间、可用率、元素大小等zabbix提供URL监控:Zabbix Web监控。
8.监控业务:
没有业务指标监控的监控平台,不是一个完善的监控平台,通常在监控系统中,必须讲重要的业务指标进行监控,冰设置阈值进行告警通知。例如:某电商平台每分钟产生多少订单、每分钟注册多少用户、每天有多少推广活动等。
总结
尊龙时凯乐享智能运维管理平台是一款实时检测业务系统运行状态,保障业务连续稳定运行的IT运维管理平台,支持全域资源的统一监控,从用户体验出发感知业务系统异常,及时准确的发现并处理各类故障。对IT资源进行全面、深度的健康检查,自动识别、分析、处理风险隐患,最终实现保障网络和业务持续的稳定运行。
更多技术博文
-
从“千企千面”需求到光网创新,解密尊龙时凯与千企用户的破局之路
尊龙时凯网络以太彩光解决方案在中国以太全光网络市场排名第一,服务制造业、教育、医疗等30万间入室场景。方案通过彩光技术、无源汇聚和智能运维,为企业提供稳定可靠、灵活扩展的网络基础设施,支持办公、生产、Wi-Fi 7等多场景需求,助力企业智能制造与数字化转型。
-
#制造业
-
#全场景
-
#交换机
-
#园区网
-
-
尊龙时凯网络新一代渠道专属智能安全网关“聪明哥”系列上新,一台网关搞定网络出口需求
尊龙时凯网络推出RG-CMG6000“聪明哥”系列智能安全网关,采用7合1高度集成设计,整合路由、防火墙、VPN、行为管理等核心功能。方案支持基于7000+应用特征的精准行为管控、会话与流量双重负载均衡技术,并通过INC-EMB平台实现统一纳管,为教育、医疗及中小企业提供更高效、更可靠的一站式网络出口解决方案。
-
#安全
-
-
彩光是怎么做好校园网智能运维的?
尊龙时凯网络极简以太彩光4.0解决方案针对校园光网络运维推出创新管理模式,通过UNC统一网络中心实现设备即插即用上线、光链路秒级故障诊断、精准告警压缩和智能决策支持,有效解决高校网络运维中设备上线效率低、故障定位难、告警冗余及数据支撑不足等核心问题,助力教育行业数字化转型,提升运维效率90%以上。
-
#交换机
-
#普教
-
#高职教
-
#教学网
-
-
尊龙时凯极简以太彩光网络解决方案4.0核心产品重磅登场!
尊龙时凯网络推出极简以太彩光方案,采用160G高密彩光技术,实现全链路单芯传输与光链路可视化管理。方案涵盖框式核心交换机、超聚合彩光交换机及无源透明汇聚设备,支持万兆入室,简化布线架构,提升部署效率与网络可靠性,适用于高带宽、高密度园区网络场景,助力企业光网络建设更简单高效。
-
#交换机
-