Thanks to visit codestin.com
Credit goes to flashcat.cloud

夜莺监控设计思考(五)告警原理和处理流程深度剖析

这将是一个系列,讲解夜莺监控的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。本篇聊聊夜莺最核心的逻辑:告警。涉及告警事件的产生、告警事件的后续处理、告警事件的通知。
夜莺监控设计思考(五)告警原理和处理流程深度剖析

夜莺监控设计思考(四)关于机器那些事儿

这将是一个系列,讲解夜莺监控的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。本篇聊聊夜莺里跟机器相关的那些事,机器的数据采集、机器的归组打标签、机器的元信息、机器的告警分派等。
夜莺监控设计思考(四)关于机器那些事儿

夜莺监控设计思考(三)时序库、agent 的一些设计考量

这将是一个系列,讲解夜莺监控的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。本篇介绍夜莺和时序库、agent 的一些设计考量。
夜莺监控设计思考(三)时序库、agent 的一些设计考量

夜莺监控设计思考(二)边缘机房架构思考

这将是一个系列,讲解夜莺监控的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。本篇介绍夜莺边缘机房架构思考。
夜莺监控设计思考(二)边缘机房架构思考

夜莺监控设计思考(一)整体定位、架构设计、单进程多进程选择、高可用设计

这将是一个系列,讲解夜莺监控的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。
夜莺监控设计思考(一)整体定位、架构设计、单进程多进程选择、高可用设计

日志告警新选择:Flashduty Monitors 全面支持 Loki 和 VictoriaLogs

在云原生时代,日志监控已成为可观测性体系的核心支柱。Flashduty Monitors 告警引擎现已全面支持 Grafana Loki 和 VictoriaLogs 数据源,提供原生查询语法兼容、三种告警模式、智能恢复机制等强大功能,助力团队构建可靠的日志告警能力。

Vector 日志采集实战:采集夜莺日志推送 VictoriaLogs 完整教程

详细教程:使用 Vector 采集 Nightingale 夜莺监控系统日志并推送至 VictoriaLogs,包含 Docker 容器化部署、VRL 日志解析配置、Elasticsearch 协议对接等完整实践步骤。
Vector 日志采集实战:采集夜莺日志推送 VictoriaLogs 完整教程

UDP端口探活的那些细节

UDP 是无连接的,无法用建立连接的形式判断端口是否存活,如何为 Categraf 实现一个简单通用的 UDP 探测插件呢?
UDP端口探活的那些细节

重构 Categraf SNMP 调度器:从随机抖动到确定性自适应

剖析 Categraf 针对 SNMP 插件的调度重构过程。从最初的简单 Ticker 到参考 Zabbix 实现最小堆与墙上时钟对齐,再到通过 0.85 因子实现自适应流量整形,解决采集周期漂移与设备负载突增问题。

网络监控:交换机监控新姿势

来自社区用户写的文章,在网络监控领域利用Categraf+VictoriaMetrics替换SNMP EXporter+Prometheus,使其更加友好和方便,并且性能和扩展性进一步提高
网络监控:交换机监控新姿势

Categraf 监控采集器常见问题汇总

本文汇总了 Categraf 监控采集器在使用过程中常见的问题及其解决方案,帮助用户更好地配置和使用 Categraf,实现高效的监控数据采集与上报。
Categraf 监控采集器常见问题汇总

Categraf 托管与自升级

本文介绍 Categraf 如何通过一条命令完成自身的托管、服务启停、状态查看、自动升级。
Categraf 托管与自升级

网络监控:无线监控这个面板好养眼

来自社区用户写的文章,利用Categraf+VictoriaMetrics替换SNMP EXporter+Prometheus,紧接上篇对交换机的监控,本篇是一个无线设备的监控的案例
网络监控:无线监控这个面板好养眼

通过 Categraf SNMP 插件采集监控数据

支持 SNMP 方式采集数据的 agent 有很多,Telegraf、Categraf、Datadog-agent、snmp-exporter等,我们这次来介绍 Categraf,举一反三,原理上都是一样的。
通过 Categraf SNMP 插件采集监控数据

Categraf SNMP 插件优化:解析带单位的监控指标

Categraf SNMP 插件通过启发式算法自动提取带单位字符串中的数值,解决浪潮等服务器返回 60 degree Celsius 格式导致指标采集失败的问题,无需正则即可智能解析温度、电流等复杂格式。

如何监控多个进程的存活和CPU、内存占用

本文介绍如何使用夜莺监控(Nightingale)和 Categraf 来监控多个进程的存活性以及 CPU、内存等资源占用情况。
如何监控多个进程的存活和CPU、内存占用

Nginx stub status采集

本文讲解如何从头开始编译http_stub_status_module模块,并使用input.nginx插件采集指标。
Nginx stub status采集

Nginx upstream采集

本文讲解如何添加nginx_upstream_check模块,并使用input.nginx_upstream_check插件采集指标。
Nginx upstream采集

Nginx vts采集

本文讲解如何添加vts模块,并使用input.prometheus插件采集指标。
Nginx vts采集

巧用Categraf探针mtail插件实现系统日志监控告警

目前市面上对于日志监控告警的主流方案主要围绕ELK及其变种展开,通过探针采集系统日志写入Kafka,然后基于Kakfa消费数据写入ES,采用定时查询ES 做异常告警;另一种方案则是基于Kafka流式数据,采用Flink直接做异常告警,架构上比较复杂。这里介绍使用mtail的轻量级方案。
巧用Categraf探针mtail插件实现系统日志监控告警

标签
ai aiops alertmanager apache apiserver apm azure categraf catpaw ccf chatgpt chatops clickhouse controller-manager coredump cprobe cslo datadog devops dns docker ebpf elasitcsearch elastalert elasticsearch etcd etl faq featureflag filelog flashcat flashcat产品 flashduty flashduty-changelog fluentbit fluentd gdpr gitops golang google gpu grafana grok_exporter hadoop hana haproxy hdfs helm httpstat huatuo iac ibex ilo im协同 incident it监控 jaeger jenkins jmx jmx-exporter jolokia jvm k8s kafka kibana kube-proxy kube-state-metrics kubelet kubernetes linkedin linux linux监控 llm log log-monitor logging logs loki metrics metricshub metricsql mimir mimirtool mongodb mongodb监控 monitoring mtail mysql mysql调优 mysql监控 netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opensearch opentelementry opentelemetry oracle监控 otel pagerduty pingmesh postgresql procstat product-feature prometheus prometheus告警 promql promxy rancher redis rum salt scheduler siglens signoz skywalking sla sli slo snmp snmp-exporter spanconnector sre syslog telegraf tidb traces tracing troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星 不可变基础设施 出海 出海业务 创业 错误预算 错误预算机制 大厂实践 大模型 大模型智能oncall 滴滴夜莺 钉钉 钉钉通知 飞书 飞书通知 服务稳定性 告警 告警oncall 告警丰富 告警风暴 告警规则 告警降噪 告警聚合 告警排班 告警认领 告警升级 告警事件 告警收敛 告警数据孤岛 告警通知 告警响应 告警协同 告警抑制 告警引擎 告警值班 告警指派 告警自愈 根因定位 故障 故障复盘 故障管理 计算机学会 架构师 监控 监控agent 监控方法论 监控告警 监控工具 监控设计思考 监控系统 监控系统合规 进程监控 开源 开源监控 开源商业化 开源夜莺 可观测平台 可观测性 可观测性论坛 可观测性体系建设 客户案例 快猫 快猫星云 连锁门店 链路追踪 埋点监控 面试题 灭火图 普罗米修斯 企微通知 企业微信 人工智能 日志 日志采集 日志存储 日志分析 日志告警 日志监控 容器 熔断 时序库 时序数据库 事件监控 手把手构建生产级监控系统 他山之石 提问的智慧 通知规则 统一监控 网络可观测性 网络排障 尾采样 稳定性保障 稳定性方法论 稳定性体系 稳定性体系建设 系统架构设计 信创 业务监控 夜莺 夜莺v8 夜莺短信告警 夜莺黄埔营 夜莺监控 夜莺开发者创新论坛 夜莺开源项目 夜莺业务组 夜莺用户案例 医药健康 仪表盘 用户案例 云厂商 云原生监控 云原生组织 运维 运维百家讲坛 运维告警 运维监控 运维监控系统 运维监控系统实战笔记 智能oncall 智能告警 自监控 最佳实践
快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat
Flashduty
Flashduty