腾讯mini项目-【指标监控服务重构】2023-08-20

今日已办

PPT制作

答辩流程

  1. 概述:对项目背景、架构进行介绍(体现我们分组的区别和需求)
  2. 人员:小组成员进行简短的自我介绍和在项目中的定位,分工
  3. 进展:对项目进展介绍,其中a、b两组的区别和工作中遇到的重难点由相应组员进行展开分析
  4. 展示:分组用视频或者图片进行短期成果展示
  5. 展望:项目后续的规划和期望的最终成果

分工及负责任务

  1. 作为b组小组的组长
    1. 负责整体项目进度的把控
    2. 项目需求的落地和小组成员的分工安排
    3. 定期与导师开展线上会议汇报项目进度和问题,同样也与另一个小组的组长协作沟通交流问题
  2. 同样在组内负责部分开发的任务
    1. 【SLI】包括 SLI 的设计和修改
    2. 【接入otel-sdk】部署 SigNoz-Collector 集成到项目的 compose 中
    3. 【接入otel-sdk】在 profile 模块中接入 otel-sdk 完成 trace 和 metric 的上报
    4. 使用 watermill-pubsub 框架替换为原有框架 baserunner

重难点

  • SLI

    • SRE(Site Reliability Engineering),边缘可靠性工程,监控性能、高可用性、可扩展性和安全性

    • SLI标准-百分比(cpu利用率)、SLO目标(延时200ms)、SLA协议

  • otel-trace

    • 【已完成】分布式跨进程跨服务的调用的 span 的上下文传播
    • span references
  • otel-metric

    • cpu、memory的方案
      • 程序主动上报 - 程序性能瓶颈无法去主动上报就无法收集到目标指标
      • docker stats receiver 来收集 docker container 的指标
      • hostmetric receiver 可指定进程
      • 云原生,后续整个服务以 k8s 的形式部署故放弃 docker stats 的方案,SigNoz有提供k8s下收集pod指标的官方方式【仍需后续调研】
  • watermill-pubsub

    1. 【已完成】publisher没有提供回调函数-修改源码嵌入 otel-trace&log 的逻辑
    2. 【尚未完成】watermill-kafka 底层依赖 sarama,需要自定义实现pub/sub替换为底层依赖 kafka-go

效果展示

Trace

Metric

Log

明日待办

  1. PPT 汇报
  2. 与导师开会
相关推荐
焦点链创研究所7 小时前
万鑫智投打造财富管理交易大模型,重构智能交易新生态
重构
金融RPA机器人丨实在智能18 小时前
2026动态规划新风向:实在智能Agent如何以自适应逻辑重构企业效率?
算法·ai·重构·动态规划
Kiyra1 天前
从《守望先锋》2026前瞻,看大型分布式系统的“重构”与“并发挑战”
运维·服务器·重构
Grassto1 天前
12 go.sum 是如何保证依赖安全的?校验机制源码解析
安全·golang·go·哈希算法·go module
Niuguangshuo1 天前
DALL-E 3:如何通过重构“文本描述“革新图像生成
人工智能·深度学习·计算机视觉·stable diffusion·重构·transformer
天天进步20151 天前
Motia性能进阶与未来:从现有源码推测 Rust 重构之路
开发语言·重构·rust
TMT星球1 天前
云从科技AI智能体落地中冶京城,重构工程领域数字化辅助新范式
人工智能·科技·重构
Allen_LVyingbo1 天前
医疗AI新范式:当数理模型开始“计算”生命,传统大模型面临重构(中)
开发语言·人工智能·python·自然语言处理·重构·知识图谱
麦兜和小可的舅舅2 天前
ClickHouse 一次Schema修改造成的Merge阻塞问题的分析和解决过程
clickhouse
人机与认知实验室2 天前
人机协同:主体性的转移与重构
重构