性能监控-微服务链路追踪skywalking搭建

skywalking是什么

SkyWalking是一个可观测性分析平台和应用性能管理系统,它基于OpenTracing规范和开源的AMP系统。SkyWalking提供了分布式跟踪、服务网格遥测分析、度量聚合和可视化一体化解决方案。具体来说,SkyWalking可以帮助我们看到一个请求经过的所有调用链路,包括微服务调用和各种中间件调用。它也可以提供服务监控,比如监控哪些服务调用失败了,服务被访问了多少次。SkyWalking的核心部分包括Agent(探针)和OAP(后端服务)。Agent负责采集服务实例的Trace、Metrics等数据,然后通过gRPC方式上报给SkyWalking后端。SkyWalking后端服务则负责接收Agent上报的数据,交给Analysis Core进行流式分析,最终将分析得到的结果写入持久化存储中。

中文文档:hong设置 (skyapm.github.cio)

参考:微服务链路追踪SkyWalking的介绍和部署_skywalking部署_技术闲聊DD的博客-CSDN博客

参考:链路追踪SkyWalking整合项目以及数据持久化_skywalking 持久化_技术闲聊DD的博客-CSDN博客

Liunx部署skywalking以及skywalking基本使用_linux部署skywalking_LiuEastHua的博客-CSDN博客

官方demo:

Apache SkyWalking

skywaking架构

Skywalking架构图,可以分成几个部分,简单来说,可以分成oap、webapp和agent三部分:

oap是skywalking最核心的部分,主要用于汇总数据、存储数据、提供对外的相关接口;

webapp主要提供了ui界面,并且从oap获取数据并且展示(通常和oap部署在服务端,相当于skywalking服务的后台监控管理程序);

agent是探针,部署在需要收集数据的应用服务器上,并将数据同步到Skywalking平台。

下载skywalking APM

Downloads | Apache SkyWalking

解压

tar zxvf apache-skywalking-apm-9.6.0.tar.gz

解压后文件

下载java agent

agent在部署项目时需要下载到项目所在机器上。

https://skywalking.apache.org/docs/main/next/en/setup/backend/log-analyzer/

wget https://dlcdn.apache.org/skywalking/java-agent/9.0.0/apache-skywalking-java-agent-9.0.0.tgz --no-check-certificate

解压

tar zxvf apache-skywalking-java-agent-9.0.0.tgz

配置数据库

配置文件路径apache-skywalking-apm-bin/config/

可以用ES,默认是h2,我这里配置为mysql

配置mysql对于jdbcurl,修改mysql对于地址和密码

linux环境部署

cd /apache-skywalking-apm-bin/bin/

./startup.sh

启动成功后会有两个服务,如下:

skywalking-oap-server:暴露11800 和 12800 两个端口,分别为收集监控数据的端口11800和接受前端请求的端口12800,修改端口可以修改config/applicaiton.yml

skywalking-web-ui:服务会占用 8080 端口, 修改端口可以修改webapp/webapp.yml

查看日志tail -300f /apache-skywalking-apm-bin/logs/

启动成功显示如下日志

也可以分别运行oap.service.sh和 webappservice.sh,过了很久很久,竟然可以访问了,这两个脚本也没有运行结束,然后这执行窗口也不能关,关了后skywalking就也不能用了。

实际这样的日志就是对的

避坑指南

问题1 jdk版本错误

Error: A JNI error has occurred, please check your installation and try again

Exception in thread "main" java.lang.UnsupportedClassVersionError: org/apache/skywalking/oap/server/webapp/ApplicationStartUp has been compiled by a more recent version of the Java Runtime (class file version 55.0), this version of the Java Runtime only recognizes class file versions up to 52.0

说明应该用jdk11版本,而我的jdk是1.8的。

安装jdk11版本。

问题2 mysql驱动不对

启动,报错

Failed to get driver instance for jdbcUrl=jdbc:mysql,可以知道是mySQL的驱动不对。

skywalking使用笔记 - 知乎 (zhihu.com)

在ops-lib加上MySQL驱动包,下载地址MySQL :: Download Connector/J

我下载的是depend platform版本,解压后,把jar包放到ops-lib下。

显示version of OAP后,start脚本仍然在运行,也无法访问。

反应很慢

如上应该是启动成功了

问题3 windows闪退

用windows部署,同样修改数据库配置,添加mysql驱动,启动startup.bat闪退

百度说是文件夹路径有中文或者空格,去掉了空格,启动startup.bat解决。

问题4 webservice.bat窗口闪退

查看时jdk版本不对,电脑同时有两个版本,读到了jdk8 应该读11,需要修改下环境变量。

改了jdk版本还是不对,手动输入命令

java -jar E:\sky\apache-skywalking-apm-9.0.0\apache-skywalking-apm-bin\webapp\skywalking-webapp.jar --spring.config.location=E:\sky\apache-skywalking-apm-9.0.0\apache-skywalking-apm-bin\webapp\webapp.yml --logging.file=E:\sky\apache-skywalking-apm-9.0.0\apache-skywalking-apm-bin\logs\webapp.log

问题5 报错logback

卡住了,不知道怎么解决。

问题6 yaml报错

运行9.6.0版本又报错yaml文件

问题7

Caused by: io.netty.channel.AbstractChannel$AnnotatedConnectException: finishConnect(..)

问题8

隔天再次启动,发现报错mysql。

The last packet sent successfully to the server was 0 milliseconds ago. The driver has not received any packets from the server.

检查application.yaml中mysql的地址账号密码是否正确。

问题9 前端访问显示404--未解决

日志显示前端已启动,但是访问显示4040

部署java项目

下载一个测试jar

curl -O https://arthas.aliyun.com/math-game.jar

使用java agent,启动项目

nohup java -javaagent:skywalking-agent.jar -Dskywalking.agent.service_name=admin -jar adminmath-game.jar > /dev/null 2>&1 &

启动后,在skywalking 常规服务-服务,可以看到启动的service。

windows环境部署

部署skywalking

1、准备好jdk11环境,设置环境变量。

2、修改application.yaml里数据库配置。我这里还用的mysql

3、mysql驱动放到ops-lib文件夹

用的是这个MySQL :: Download Connector/J

4、启动oapService.bat

5、启动webappService.bat

日志路径:D:\software\apache-skywalking-apm-9.6.0\apache-skywalking-apm-bin\logs

启动成功标志,查看日志:

数据库自动创建数据表

访问skywalking

访问:http://127.0.0.1:8080/

部署項目

java -javaagent:skywalking-agent.jar -Dskywalking.agent.service_name=UserApplication -jar UserApplication-SNAPSHOT.jar

报错

ERROR 2023-10-08 17:13:23.672 main SnifferConfigInitializer : Failed to read the config file, skywalking is going to run in default config.

org.apache.skywalking.apm.agent.core.conf.ConfigNotFoundException: Failed to load agent.config.

配置文件加载失败,因为偷懒直接把agent.jar复制到了一个文件执行的命令。

再次在agent目录下执行命令

java -javaagent:skywalking-agent.jar -Dskywalking.agent.service_name=UserApplication -jar D:\Project\UserApplication\target\UserApplication-SNAPSHOT.jar

可以看到提示8080端口被占用了,所以需要指定端口启动

java -Dserver.port=8090 -javaagent:skywalking-agent.jar -Dskywalking.agent.service_name=UserApplication -jar D:\Project\UserApplication\target\UserApplication-SNAPSHOT.jar

启动成功

启动后,在skywalkig会多出一个常规服务模块,点进去可以看到部署的服务。

修改skywalking服务地址

skywalking-agent默认连接的是本机的skywalking,如果要修改配置,

修改配置文件:agent.config,修改

(1)服务名(The service name in UI),随意

(2)服务器地址(Backend service addresses)

docker部署

参考基于Docker部署Skywalking-CSDN博客

Docker部署SkyWalking+ElasticSearch+Agent - 知乎

如下为一个错误的命令。

bash 复制代码
docker run --restart=always -p 9400:9400 -p 9500:9500 -e "discovery.type=single-node" \
-e ES_JAVA_OPTS="-Xms512m -Xmx512m" \
--name='elasticsearch_sky' --cpuset-cpus="1" -m 2G -d elasticsearch:7.6.2

docker run --name oap --restart always -d --restart=always -e TZ=Asia/Shanghai -p 12800:12800 -p 11800:11800 --link elasticsearch_sky:elasticsearch -e SW_STORAGE=elasticsearch7 -e SW_STORAGE_ES_CLUSTER_NODES=服务器IP地址:9400 apache/skywalking-oap-server:8.3.0-es7


docker run -d --name skywalking-ui \
--restart=always \
-e TZ=Asia/Shanghai \
-p 8088:8080 \
--link oap:oap \
-e SW_OAP_ADDRESS=oap:12800 \
apache/skywalking-ui:8.3.0

访问8088发现未打开

问题1 ES连接失败

查看日志

docker logs oap服务的容器ID

连接ES失败。

查看ES日志,发现 ES里用的IP地址为172开头。

修改oap启动命令重新启动,这里oap和ui都需要重新启动,因为oap容器name改了。

bash 复制代码
docker run --name oap1 --restart always -d --restart=always -e TZ=Asia/Shanghai -p 12800:12800 -p 11800:11800 --link elasticsearch_sky:elasticsearch -e SW_STORAGE=elasticsearch7 -e SW_STORAGE_ES_CLUSTER_NODES=172.17.0.2:9200 apache/skywalking-oap-server:8.3.0-es7




docker run -d --name skywalking-ui1 \
--restart=always \
-e TZ=Asia/Shanghai \
-p 8088:8080 \
--link oap1:oap1 \
-e SW_OAP_ADDRESS=oap1:12800 \
apache/skywalking-ui:8.3.0

注意ES服务器的地址,我这里填写ES日志里的172.17.0.2:9200才成功。

可以curl校验一下,如果curlES端口提示Connection refused,那么ES端口是不能用,具体怎么不能用可以查一下。

访问8088端口,成功,这是8.3.0版本的skywalking比较老了,可以部署新的。

部署docker项目

需要注意的一点是docker部署的项目,需要把agent打进镜像中,详细见下面文章。

使用Skywalking监控你的服务-简单部署_skywalking 监控不了-CSDN博客

微服务整合skywalking,也需要把agent放入工程内。 修改微服务的启动VM option。

企业级监控项目Skywalking详细介绍,来看看呀_一一哥Sun的博客-CSDN博客

相关推荐
掘金-我是哪吒9 小时前
微服务mysql,redis,elasticsearch, kibana,cassandra,mongodb, kafka
redis·mysql·mongodb·elasticsearch·微服务
茶馆大橘10 小时前
微服务系列六:分布式事务与seata
分布式·docker·微服务·nacos·seata·springcloud
58沈剑11 小时前
80后聊架构:架构设计中两个重要指标,延时与吞吐量(Latency vs Throughput) | 架构师之路...
架构
想进大厂的小王13 小时前
项目架构介绍以及Spring cloud、redis、mq 等组件的基本认识
redis·分布式·后端·spring cloud·微服务·架构
九卷技术录14 小时前
(微服务)服务治理:几种开源限流算法库/应用软件介绍和使用
微服务·服务治理·限流算法
阿伟*rui14 小时前
认识微服务,微服务的拆分,服务治理(nacos注册中心,远程调用)
微服务·架构·firefox
ZHOU西口15 小时前
微服务实战系列之玩转Docker(十八)
分布式·docker·云原生·架构·数据安全·etcd·rbac
deephub17 小时前
Tokenformer:基于参数标记化的高效可扩展Transformer架构
人工智能·python·深度学习·架构·transformer
想进大厂的小王17 小时前
Spring-cloud 微服务 服务注册_服务发现-Eureka
微服务·eureka·服务发现
架构师那点事儿18 小时前
golang 用unsafe 无所畏惧,但使用不得到会panic
架构·go·掘金技术征文