技术栈
监控
key_Go
4 天前
运维
·
网络
·
网络协议
·
docker
·
监控
07.容器监控
容器技术的普及带来了部署效率的提升,但也增加了监控的复杂性。与传统服务器监控不同,容器具有生命周期短、动态迁移、资源隔离等特点,需要专门的监控策略和工具。本文将从基础命令到高级监控系统,全面讲解容器监控的实现方法。
颜如玉
6 天前
后端
·
源码
·
监控
Trace Sql:打通全链路日志最后一里路
笔者之前遇到一个Bug,简单描述就是有一字段由笔者和同事共同维护,最后发现该字段与实际情况不符。绝大多数生产环境一定不会打印SQL语句,且我们各自负责的模块业务没有互相交叉理解,因此比较难判断问题根源。 后面我使用阿里云的SQL洞察,获取到该条记录的更新历史,才还笔者清白。原因是同事后续的操作将字段更新错误。当时还好两个操作时间有一定的时间差,才比较断定。所以当时我就想如果SQL语句也能携带上TraceId就方便回溯,铁证如山。
handsome12345
12 天前
运维
·
mysql
·
centos
·
zabbix
·
监控
·
centos8
·
zabbix6
·
linux源
CentOS 8.5.2.111部署Zabbix6.0 手把手、保姆级
CentOS 8.5.2.111部署Zabbix6.0 手把手、保姆级前提、设置网络Ip地址等重启网络服务,效果不好时重启服务器
鼠鼠我捏,要死了捏
20 天前
spring boot
·
监控
·
actuator
Spring Boot Actuator自定义指标与监控实践指南
本篇文章以生产环境实战经验为主线,结合某电商系统的业务场景,讲解如何在Spring Boot Actuator中添加并暴露自定义指标,并使用Prometheus和Grafana进行完整的监控与告警配置。
可观测性用观测云
22 天前
监控
Openresty Tracing 最佳实践
OpenResty 是基于 Nginx 的高性能 Web 平台,它通过集成 Lua 脚本引擎和一系列模块,扩展了 Nginx 的功能,使开发者可以使用 Lua 编写复杂的应用逻辑。对 OpenResty 进行链路追踪,能在分布式系统中清晰呈现请求经 Nginx 转发后的完整路径,这不仅让问题定位更高效,可快速锁定延迟、错误等问题发生的具体环节,还能通过追踪其处理请求的耗时、转发延迟等数据,精准识别系统性能瓶颈,为优化资源分配和架构设计提供依据。
可观测性用观测云
1 个月前
监控
连锁门店可用性监测和进程监测最佳实践
在连锁零售企业的数字化运营中,多门店通过网络实时访问总部业务系统(如收银、库存、会员管理等核心模块)是其日常经营的基础支撑。然而,由于门店分布广泛、网络环境复杂,网络或应用服务的任何中断都可能直接阻断交易流程、影响顾客体验,进而造成即时营收损失与长期品牌信任损耗。据行业调研,门店单次网络中断平均会造成 15-30 分钟的业务停滞,高峰时段(如周末、节假日)单店每小时营收损失可达数千元,叠加顾客投诉与复购率下降的隐性成本,对门店整体收益与品牌口碑形成显著冲击。
一枚前端小能手
1 个月前
前端
·
监控
🚀 应用出了问题你都不知道,别着急我来帮你
🎯 学习目标:掌握前端监控体系的核心指标和搭建方法,让线上问题无处遁形📊 难度等级:中级-高级 🏷️ 技术标签:#前端监控 #性能指标 #用户体验 #错误监控 ⏱️ 阅读时间:约8分钟
可观测性用观测云
1 个月前
监控
Milvus 可观测性最佳实践
Milvus 是一个开源的向量数据库,专为处理大规模、高维度向量数据而设计,广泛应用于人工智能、推荐系统、图像检索、自然语言处理等场景。它支持亿级向量的高效存储与快速检索,内置多种相似度搜索算法(如 HNSW、IVF、FLAT),并支持 GPU 加速,极大提升了检索性能。Milvus 提供易用的 API 接口,兼容多种数据格式,支持水平扩展,方便集成到各类 AI 应用中,是构建智能搜索系统的理想选择。
岚天start
1 个月前
linux
·
运维
·
网络
·
监控
·
扫描
·
连通性
·
流量
Linux系统网络排查工具总结
在Linux系统中,网络排查工具是系统管理、开发和运维的核心组件,主要用于诊断网络连通性问题、分析流量、测试性能及监控路由状态。工具选择应优先考虑功能的现代性,并结合实际需求使用。
可观测性用观测云
1 个月前
监控
Ceph 可观测性最佳实践
Ceph 是一种高性能、高可扩展性和高可靠性的开源分布式存储系统,广泛应用于云计算、大数据和高性能计算等领域。它通过其核心组件(如对象存储守护进程OSD、元数据服务器MDS和监控守护进程MON)协同工作,利用 CRUSH 算法实现数据的分布存储和动态负载均衡,支持对象存储、块存储和文件存储等多种存储接口,能够灵活满足不同场景下的存储需求。
云游
2 个月前
grafana
·
prometheus
·
可视化
·
监控
大模型性能指标的监控系统(prometheus3.5.0)和可视化工具(grafana12.1.0)基础篇
Prometheus是云原生计算基金会项目,是一个系统和服务监控系统。它以给定的时间间隔从配置的目标收集指标,评估规则表达式,显示结果,并在观察到指定条件时触发警报。
海风极客
2 个月前
监控
一个案例带你搞懂Prometheus指标类型(下)
这篇文章我们继续来分享Prometheus的四大指标类型,经过了上一篇文章的讲解,我们已经搭建好了项目,现在就开始配置Prometheus,让它能够从我们的项目运行过程中拉取监控数据。
可观测性用观测云
2 个月前
监控
OpenTelemetry WebSocket 监控终极方案:打通最后一公里
OpenTelemetry,以下简称 OTEL,是由 CNCF 托管的“一站式可观测性标准”,把指标、链路、日志三大信号统一为单一 SDK/API,零侵入地采集从浏览器、移动端到后端、容器、云服务的全栈遥测数据,并支持 40+ 后端一键导出,让分布式系统的黑盒瞬间变透明。
可观测性用观测云
2 个月前
监控
观测云接收 OpenTelemetry Collector 数据最佳实践
如果你在做系统运维或开发,建设可观测性必然是近年来一个少不了的课题,同时相信你对 OpenTelemetry 也一定不陌生。OpenTelemetry 提供了一个统一、开放且不受特定厂商限制的标准和工具集,使得我们可以一次性集成 OTel SDK,全面采集应用的指标、日志和链路追踪数据,并自由地将数据发送到任何支持 OTel 协议的后端。
SRETALK
2 个月前
运维
·
监控
·
自动化运维
夜莺开源监控,模板函数一览
本文介绍夜莺开源项目(Nightingale)的模板函数,夜莺内置了很多模板函数,可以对告警事件做一些渲染调整,方便 On-call 人员根据告警事件处理告警。
可观测性用观测云
2 个月前
监控
使用观测云打造企业级监控告警中心
在当今的数字化时代,企业级 IT 系统的复杂性和规模日益增长,监控和告警成为了保障业务连续性和系统稳定性的关键环节。然而,传统的监控和告警系统往往存在诸多痛点:告警数据源分散、告警策略单一、告警触达不及时、告警数据分析不足等。这些问题不仅增加了运维人员的工作负担,还可能导致关键告警被忽略,进而影响业务的正常运行。因此,建设一个统一的监控、告警平台,成为了集团性企业的迫切需求。本文将详细介绍我们在集团性企业落地统一监控告警的部分场景。
可观测性用观测云
2 个月前
监控
DataKit 采集器敏感信息加密最佳实践
敏感信息如密码、账号信息等,如果您希望避免在配置文件中以明文存储这些信息,则可以使用该功能。如密码加密,DataKit 在启动加载采集器配置文件时遇到 ENC[] 时会在文件、env、或者 AES 加密得到密码后替换文本并重新加载到内存中,以得到正确的密码。