技术栈
监控
Devin_Zhang
4 天前
监控
·
aws
AWS EKS部署Prometheus和Grafana
一、创建Prometheus工作区1.创建工作区为了可以把Prometheus数据写入到AWS managed Prometheus,需要先在AWS Prometheus控制台中创建工作区
AHUGEFATTY
6 天前
监控
·
netdata
离线安装NetData:高效监控服务器指南
离线获取netdatacurl https://get.netdata.cloud/kickstart.sh > /tmp/netdata-kickstart.sh
可观测性用观测云
8 天前
监控
FastDFS 可观测性最佳实践
FastDFS(Fast Distributed File System)是一种开源的分布式文件系统,具有高可靠性、高可扩展性、高性能等特点,被广泛应用于互联网领域的大规模文件存储和共享中。
会飞的小蛮猪
12 天前
elasticsearch
·
监控
·
自动化运维
Prometheus运维之路(ES监控接入)
最近公司因为新项目业务需求,接入了ES集群,为了观察ES相关指标所以也接入到了Prometheus当中,这个是我在测试环境中接入单节点的过程。仅供参考。
key_Go
25 天前
运维
·
网络
·
网络协议
·
docker
·
监控
07.容器监控
容器技术的普及带来了部署效率的提升,但也增加了监控的复杂性。与传统服务器监控不同,容器具有生命周期短、动态迁移、资源隔离等特点,需要专门的监控策略和工具。本文将从基础命令到高级监控系统,全面讲解容器监控的实现方法。
颜如玉
1 个月前
后端
·
源码
·
监控
Trace Sql:打通全链路日志最后一里路
笔者之前遇到一个Bug,简单描述就是有一字段由笔者和同事共同维护,最后发现该字段与实际情况不符。绝大多数生产环境一定不会打印SQL语句,且我们各自负责的模块业务没有互相交叉理解,因此比较难判断问题根源。 后面我使用阿里云的SQL洞察,获取到该条记录的更新历史,才还笔者清白。原因是同事后续的操作将字段更新错误。当时还好两个操作时间有一定的时间差,才比较断定。所以当时我就想如果SQL语句也能携带上TraceId就方便回溯,铁证如山。
handsome12345
1 个月前
运维
·
mysql
·
centos
·
zabbix
·
监控
·
centos8
·
zabbix6
·
linux源
CentOS 8.5.2.111部署Zabbix6.0 手把手、保姆级
CentOS 8.5.2.111部署Zabbix6.0 手把手、保姆级前提、设置网络Ip地址等重启网络服务,效果不好时重启服务器
鼠鼠我捏,要死了捏
1 个月前
spring boot
·
监控
·
actuator
Spring Boot Actuator自定义指标与监控实践指南
本篇文章以生产环境实战经验为主线,结合某电商系统的业务场景,讲解如何在Spring Boot Actuator中添加并暴露自定义指标,并使用Prometheus和Grafana进行完整的监控与告警配置。
可观测性用观测云
1 个月前
监控
Openresty Tracing 最佳实践
OpenResty 是基于 Nginx 的高性能 Web 平台,它通过集成 Lua 脚本引擎和一系列模块,扩展了 Nginx 的功能,使开发者可以使用 Lua 编写复杂的应用逻辑。对 OpenResty 进行链路追踪,能在分布式系统中清晰呈现请求经 Nginx 转发后的完整路径,这不仅让问题定位更高效,可快速锁定延迟、错误等问题发生的具体环节,还能通过追踪其处理请求的耗时、转发延迟等数据,精准识别系统性能瓶颈,为优化资源分配和架构设计提供依据。
可观测性用观测云
2 个月前
监控
连锁门店可用性监测和进程监测最佳实践
在连锁零售企业的数字化运营中,多门店通过网络实时访问总部业务系统(如收银、库存、会员管理等核心模块)是其日常经营的基础支撑。然而,由于门店分布广泛、网络环境复杂,网络或应用服务的任何中断都可能直接阻断交易流程、影响顾客体验,进而造成即时营收损失与长期品牌信任损耗。据行业调研,门店单次网络中断平均会造成 15-30 分钟的业务停滞,高峰时段(如周末、节假日)单店每小时营收损失可达数千元,叠加顾客投诉与复购率下降的隐性成本,对门店整体收益与品牌口碑形成显著冲击。
一枚前端小能手
2 个月前
前端
·
监控
🚀 应用出了问题你都不知道,别着急我来帮你
🎯 学习目标:掌握前端监控体系的核心指标和搭建方法,让线上问题无处遁形📊 难度等级:中级-高级 🏷️ 技术标签:#前端监控 #性能指标 #用户体验 #错误监控 ⏱️ 阅读时间:约8分钟
可观测性用观测云
2 个月前
监控
Milvus 可观测性最佳实践
Milvus 是一个开源的向量数据库,专为处理大规模、高维度向量数据而设计,广泛应用于人工智能、推荐系统、图像检索、自然语言处理等场景。它支持亿级向量的高效存储与快速检索,内置多种相似度搜索算法(如 HNSW、IVF、FLAT),并支持 GPU 加速,极大提升了检索性能。Milvus 提供易用的 API 接口,兼容多种数据格式,支持水平扩展,方便集成到各类 AI 应用中,是构建智能搜索系统的理想选择。
岚天start
2 个月前
linux
·
运维
·
网络
·
监控
·
扫描
·
连通性
·
流量
Linux系统网络排查工具总结
在Linux系统中,网络排查工具是系统管理、开发和运维的核心组件,主要用于诊断网络连通性问题、分析流量、测试性能及监控路由状态。工具选择应优先考虑功能的现代性,并结合实际需求使用。
可观测性用观测云
2 个月前
监控
Ceph 可观测性最佳实践
Ceph 是一种高性能、高可扩展性和高可靠性的开源分布式存储系统,广泛应用于云计算、大数据和高性能计算等领域。它通过其核心组件(如对象存储守护进程OSD、元数据服务器MDS和监控守护进程MON)协同工作,利用 CRUSH 算法实现数据的分布存储和动态负载均衡,支持对象存储、块存储和文件存储等多种存储接口,能够灵活满足不同场景下的存储需求。
云游
2 个月前
grafana
·
prometheus
·
可视化
·
监控
大模型性能指标的监控系统(prometheus3.5.0)和可视化工具(grafana12.1.0)基础篇
Prometheus是云原生计算基金会项目,是一个系统和服务监控系统。它以给定的时间间隔从配置的目标收集指标,评估规则表达式,显示结果,并在观察到指定条件时触发警报。
海风极客
2 个月前
监控
一个案例带你搞懂Prometheus指标类型(下)
这篇文章我们继续来分享Prometheus的四大指标类型,经过了上一篇文章的讲解,我们已经搭建好了项目,现在就开始配置Prometheus,让它能够从我们的项目运行过程中拉取监控数据。