Netdata系统监控:30秒定位服务器故障的实践方法

文章目录

前言

服务器突然无响应,日志文件刷满错误信息?Netdata这个开源监控工具或许能帮你快速止损------它以毫秒级精度记录系统指标,异常检测功能在问题恶化前发出预警,对比分析模式还原故障发生前的运行状态。

配合cpolar内网穿透,远程排查故障变得简单。比如周末在家收到服务器报警,通过cpolar链接访问办公室电脑上的Netdata面板,发现是某个进程内存泄漏导致的OOM,远程重启服务后恢复正常。整个过程不到5分钟,避免了不必要的上门运维。

本文主要介绍如何在Linux Ubuntu系统使用Docker本地部署Netdata,并结合cpolar内网穿透工具实现远程访问本地服务器上的Netdata,轻松实现远程可视化监控系统的运行状态,从硬件层面到各种应用程序和服务的性能指标,无需公网IP也不用购买域名和云服务器。

1.关于Netdata

NetData 是一款强大的、开箱即用的系统和应用实时性能监控工具。它可以监控你服务器上的几乎所有东西,从CPU使用率到网络流量,再到MySQL数据库的表现。所有这些数据都会以高度互动的形式展示在一个Web仪表板上,让你一目了然。

Github地址:GitHub - netdata/netdata:为速度而设计。自动化,轻松。监控和故障排除,转变!

为什么选择Netdata?

  • 无需配置:安装后即可立即开始工作。
  • 无依赖性:几乎不需要额外的软件支持。
  • 实时监控:每秒更新的数据确保你总是看到最新的系统状态。
  • 易于理解:即使你是新手,也能轻松上手。

以下是Netdata的特点:

  • 收集来自800多个集成的数据

    操作系统指标、容器指标、虚拟机、硬件传感器、应用程序指标、OpenMetrics导出器、StatsD和日志。

  • 实时、低延迟、高分辨率

    所有数据都是每秒收集的,并在数据收集后立即在 API 上提供以进行可视化(1 秒延迟,数据收集到可视化)。

  • 全面的人工智能

    AI 针对收集的每个指标在边缘训练多个机器学习 (ML) 模型,并使用 AI 根据每个指标的过去行为检测异常。

  • systemd-journald 日志

    包括有效地将纯文本日志(文本,csv, logfmt, json)文件转换为结构化系统日志条目(,)的工具,并直接查询系统日志文件,从而实现强大的日志可视化仪表板。Netdata代理消除了集中日志的需要,并提供了直接在*'log2journal*``systemd-cat-native'中处理日志的所有功能

  • 像乐高积木一样,可观察性管道

    Netdata代理可以链接在一起(在父子关系中),以在基础设施中构建可观察性集中点,从而允许您在多个级别上控制数据复制和保留。

  • 全自动强大的可视化

    使用NIDL(节点、实例、维度和标签)数据模型,Netdata Agent可以创建全自动仪表板,提供所有指标的相关可视化,使您可以第一眼理解任何数据集,还可以直接在仪表板上过滤、切片和切块数据,而无需学习查询语言。

    注意:Netdata UI是闭源的,但可以免费与Netdata Agents和Netdata Cloud一起使用。

  • 开箱外警报

    附带数百个开箱即用的警报,用于检测常见问题和陷阱,揭示容易被忽视的问题。它支持多种通知方法,让您知道何时需要您的关注。

  • 维修费用低

    在各个方面都完全自动化:自动化仪表板、开箱即用的警报、指标的自动检测和自动发现、零接触机器学习、轻松的可扩展性和高可用性以及 CI/CD 友好。

  • 开放和可扩展

    Netdata 是一个模块化平台,可以以各种可能的方式进行扩展,并且还可以与其他监控解决方案很好地集成。

2.本地部署Netdata

本例使用Docker进行部署,如果没有安装Docker,可以查看这篇教程进行安装:《Docker安装教程------Linux、Windows、MacOS》

执行下方命令使用命令拉取镜像:

shell 复制代码
sudo docker pull netdata/netdata

现在我们来启动Netdata容器。在运行容器时我们需要映射端口,以便在浏览器中访问它。执行下方命令即可本地运行容器。

shell 复制代码
sudo docker run -d --name netdata -p 19999:19999 --restart always \
    -v netdataconfig:/etc/netdata \
    -v netdatalib:/var/lib/netdata \
    -v netdatacache:/var/cache/netdata \
    netdata/netdata

一切准备就绪后我们可以打开Ubuntu浏览器访问localhost:19999,就可以进入Netdata的web界面了

3.使用Netdata

现在我们来访问Netdata的主页面,可以发现看起来非常的高科技,我们点击右下角的skip und use the dashboard anonymously 进入监控页面。

再来看看监控页面,除了配色酷炫,监控项种类繁多之外,页面元素的实时响应、告警设置等都极具亮点。

4.cpolar内网穿透工具安装

不过我们目前只能在本地局域网内访问刚刚部署的Netdata,如果想不在同一局域网中时,也能在外部网络环境远程访问本地部署的Netdata,应该怎么办呢?我们可以使用cpolar内网穿透工具来实现远程访问本地服务的需求。无需公网IP,也不用设置路由器那么麻烦。

下面是安装cpolar步骤:

Cpolar官网地址: https://www.cpolar.com

使用一键脚本安装命令

shell 复制代码
sudo curl https://get.cpolar.sh | sh

安装完成后,执行下方命令查看cpolar服务状态:(如图所示即为正常启动)

shell 复制代码
sudo systemctl status cpolar

Cpolar安装和成功启动服务后,在浏览器上输入ubuntu主机IP加9200端口即:【http://localhost:9200】访问Cpolar管理界面,使用Cpolar官网注册的账号登录,登录后即可看到cpolar web 配置界面,接下来在web 界面配置即可:

5.创建远程连接公网地址

登录cpolar web UI管理界面后,点击左侧仪表盘的隧道管理------创建隧道:

  • 隧道名称:可自定义,本例使用了: Netdata,注意不要与已有的隧道名称重复

  • 协议:http

  • 本地地址:19999

  • 域名类型:随机域名

  • 地区:选择China Top

创建成功后,打开左侧在线隧道列表,可以看到刚刚通过创建隧道生成了两个公网地址,接下来就可以在其他电脑(异地)上,使用任意一个地址在浏览器中访问即可。

如下图所示,成功实现使用公网地址异地远程访问本地部署的Netdata

小结

为了方便演示,我们在上边的操作过程中使用cpolar生成的HTTP公网地址隧道,其公网地址是随机生成的。这种随机地址的优势在于建立速度快,可以立即使用。然而,它的缺点是网址是随机生成,这个地址在24小时内会发生随机变化,更适合于临时使用。

如果有长期使用Netdata远程使用,或者异地访问与使用其他本地部署的服务的需求,但又不想每天重新配置公网地址,还想让公网地址好看又好记并体验更多功能与更快的带宽,那我推荐大家选择使用固定的二级子域名方式来配置公网地址。

6.固定Netdata公网地址

由于以上使用cpolar所创建的隧道使用的是随机公网地址,24小时内会随机变化,不利于长期远程访问。因此我们可以为其配置二级子域名,该地址为固定地址,不会随机变化。

注意需要将cpolar套餐升级至基础套餐或以上,且每个套餐对应的带宽不一样。【cpolar.cn已备案】

点击左侧的预留,选择保留二级子域名,地区选择China Top,然后设置一个二级子域名名称,填写备注信息,点击保留。

保留成功后复制保留的二级子域名地址:

登录cpolar web UI管理界面,点击左侧仪表盘的隧道管理------隧道列表,找到所要配置的隧道,点击右侧的编辑

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名
  • 地区: China Top

点击更新

更新完成后,打开在线隧道列表,此时可以看到随机的公网地址已经发生变化,地址名称也变成了保留和固定的二级子域名名称。

最后,我们使用固定的公网地址访问Netdata可以看到访问成功,一个永久不会变化的远程访问方式即设置好了。

接下来就可以随时随地进行公网访问管理Netdata了,把公网地址分享给身边的人,还可以方便团队协作。自己用的话,无需云服务器,还可以实现异地远程访问!以上就是如何在Linux Ubuntu系统Docker本地安装Netdata并实现异地远程访问,及时获取性能数据能够帮助我们快速定位问题、优化资源配置的全部过程,感谢阅读!

总结:在系统稳定性决定业务连续性的今天,Netdata与cpolar的组合就像给服务器装上了"智能急救系统"。早一分钟发现问题,就多一分挽回损失的可能。

本篇文章知识点来源[cpolar官网][https://www.cpolar.com]

  1. cpolar博客:配置二级子域名: https://www.cpolar.com/blog/configure-the-secondary-subdomain-name
  2. cpolar博客:配置自定义域名: https://www.cpolar.com/blog/configure-your-own-domain-name
  3. cpolar博客:配置固定TCP端口地址: https://www.cpolar.com/blog/configure-fixed-tcp-port-address
  4. cpolar博客:配置固定FTP地址: https://www.cpolar.com/blog/configure-fixed-ftp-address
相关推荐
七夜zippoe5 小时前
CANN Runtime任务描述序列化与持久化源码深度解码
大数据·运维·服务器·cann
盟接之桥5 小时前
盟接之桥说制造:引流品 × 利润品,全球电商平台高效产品组合策略(供讨论)
大数据·linux·服务器·网络·人工智能·制造
Fcy6486 小时前
Linux下 进程(一)(冯诺依曼体系、操作系统、进程基本概念与基本操作)
linux·运维·服务器·进程
袁袁袁袁满6 小时前
Linux怎么查看最新下载的文件
linux·运维·服务器
代码游侠6 小时前
学习笔记——设备树基础
linux·运维·开发语言·单片机·算法
主机哥哥7 小时前
阿里云OpenClaw部署全攻略,五种方案助你快速部署!
服务器·阿里云·负载均衡
Harvey9037 小时前
通过 Helm 部署 Nginx 应用的完整标准化步骤
linux·运维·nginx·k8s
珠海西格电力科技8 小时前
微电网能量平衡理论的实现条件在不同场景下有哪些差异?
运维·服务器·网络·人工智能·云计算·智慧城市
释怀不想释怀8 小时前
Linux环境变量
linux·运维·服务器
zzzsde8 小时前
【Linux】进程(4):进程优先级&&调度队列
linux·运维·服务器