prometheus

梵得儿SHI1 天前
人工智能·微服务·grafana·prometheus·监控·可观察性·spring ai
(第二篇)Spring AI 架构设计与优化:可观察性体系,打造全链路可视化的 AI 运维方案大家好,我是深耕 AI 服务架构的后端开发。在上一篇文章里,我给大家分享了 Spring AI 从单实例到万级 QPS 分布式架构的演进方案。但架构搭完只是开始,线上运维才是真正的考验:用户反馈 AI 回答慢,却分不清是网关、向量检索还是模型调用拖了后腿;月底模型 API 账单超支,却查不到是哪个接口、哪个场景消耗了最多 Token;偶尔出现的模型调用异常,复现不了也找不到根因,只能干着急。
川石课堂软件测试2 天前
人工智能·python·功能测试·网络协议·单元测试·测试用例·prometheus
AI如何赋能软件测试行业的发展人工智能(AI)技术正在为软件测试行业带来革命性变化,通过自动化、智能化和数据分析等手段,显著提升了测试效率、覆盖率和准确性。以下是AI赋能软件测试行业的主要方式及其具体应用:
脏脏a2 天前
数据库·prometheus
监控面板全绿但用户说网站打不开?Prometheus+Blackbox从外部验证服务真实可用性运维过程中遇到过这种情况:Prometheus监控面板一片绿,所有指标看起来都正常,结果用户反馈网站打不开、API返回502、支付接口超时。查了一圈才发现问题是服务进程还在跑但网络不通、负载均衡后端已经挂了、DNS解析出了问题——这些情况都不会反映在应用内部暴露的指标里,监控显示一切正常但用户实际用不了。
.柒宇.3 天前
运维·服务器·prometheus·监控
prometheus-入门与安装Prometheus(普罗米修斯)是一款开源的系统监控和告警工具,最初由 SoundCloud 开发,2016 年加入 CNCF(云原生计算基金会),是继 Kubernetes 之后的第二个毕业项目。
川石课堂软件测试5 天前
数据库·功能测试·测试工具·jmeter·单元测试·postman·prometheus
技术分享|JMeter接口与性能测试实战在软件开发和运维过程中,接口性能测试是一项至关重要的工作。JMeter作为一款开源的Java应用,被广泛用于进行各种性能测试,包括接口性能测试。本文将详细介绍如何使用JMeter进行接口性能测试的过程和步骤。
是店小二呀5 天前
prometheus
Prometheus监控盲区:Pushgateway如何收拢离线任务指标Prometheus 用的是拉模型——监控目标起个 HTTP 服务、暴露个 /metrics 端点,Prometheus 按时来抓。这是业内标准的做法,好处是简单、可靠、不需要给监控中心开权限。
xmlhcxr5 天前
架构·grafana·prometheus
基于 HAProxy+Keepalived 构建高可用 ZrLog 博客系统及监控平台实现(Prometheus + Grafana)Nginx 更适合 “静态资源 + 简单反向代理” 场景,而 HAProxy 是为 “Web 应用高可用负载均衡” 量身设计的工具,与 ZrLog(Java Web 应用)的核心诉求(会话保持、精准健康检查、低资源高并发)高度契合
川石课堂软件测试6 天前
数据库·python·功能测试·mysql·单元测试·grafana·prometheus
软件测试:典型面试题库这种情况碰到的比较少吧,有可能项目版本迭代比较多,Bug 隐藏得比较深,而我们用例都是一些常规用例。这个时候,需要跟多去从其他的异常场景,站在用户的角度,去完善用例。检查我的测试环境是不是用错了(测试环境预生产环境验收环境是不是有问题) 再看需求分析有没有问题用例有没有覆盖到位,用例设计得好不好,多补充一些覆盖无效等价类的测试用例,然后用例在评审一下,组内让老员工或者同事帮忙审核一下,再不行就开会议评审一下需求和用例,看看用例有没有覆盖完全或者需求理解到位没,预期结果有没有遗漏
何中应7 天前
运维·prometheus·监控
Promehteus如何指定数据路径Prometheus 采集到的数据,没有指定的话,默认是在 /data 路径下,时间长了,数据会越来越多,
Elastic 中国社区官方博客7 天前
大数据·运维·elasticsearch·搜索引擎·全文检索·prometheus
使用 Remote Write 将 Prometheus 指标发送到 Elasticsearch作者:来自 Elastic Felix BarnsteinerElasticsearch 原生支持 Prometheus Remote Write。只需在你的 Prometheus 配置中添加一个 remote_write 配置块,并使用 Elasticsearch 作为兼容 Prometheus 的长期存储。
要做一个小太阳7 天前
运维·网络·prometheus
blockbox配置文件详解与优化blockbox.yml 优化blackbox 配置整理成 表格版说明,再给出 命名问题 和 优化重构建议。
Elastic 中国社区官方博客8 天前
大数据·数据库·elasticsearch·搜索引擎·信息可视化·全文检索·prometheus
Prometheus Remote Write 在 Elasticsearch 中的摄取原理作者:来自 Elastic Felix Barnsteiner深入了解 Elasticsearch 对 Prometheus Remote Write 的实现:protobuf 解析、指标类型推断、TSDS 映射以及数据流路由。
曲幽10 天前
python·prometheus·fastapi·web·async·sqlalchemy·connection·pool
FastAPI服务半夜又挂了?先别急着重启,查查你的数据库连接池“池子”是不是漏了是不是觉得你的 FastAPI 服务像个长不大的孩子,白天活蹦乱跳,一到夜深人静流量低谷时就给你来个假死、无响应?然后你迷迷糊糊被报警叫醒,骂骂咧咧重启一下又好了,仿佛什么都没发生过。第二天顶着黑眼圈去看日志,除了几条模糊的 “connection timeout” 啥也抓不住。🎯 如果这剧情你熟,那今天这篇,大概率是你的菜。
Dontla11 天前
前端·数据库·prometheus
高基数(High Cardinality)问题介绍(Prometheus、高基数字段、低基数字段)基数(Cardinality):指数据集中某个字段不同值的数量。例如:❌ 不适合做标签/维度的字段:高基数问题是时序数据库和监控系统中的常见挑战,需要在数据建模阶段就充分考虑,避免后期性能问题。
川石课堂软件测试12 天前
数据库·python·功能测试·测试工具·单元测试·grafana·prometheus
requests接口自动化测试接口测试是测试系统组件间接口的一种测试。接口测试主要用于检测外部系统与系统之间以及内部各个子系统之间的交互点。测试的重点是要检查数据的交换,传递和控制管理过程,以及系统间的相互逻辑依赖关系等。
没有口袋啦12 天前
grafana·prometheus
基于 Prometheus + Grafana 的云原生立体化监控体系构建在云原生架构中,系统就像一个“黑盒”。如果没有监控,任何故障排查无异于盲人摸象。Prometheus + Grafana 的组合是目前 SRE/运维领域绝对的行业标准。
Dontla12 天前
数据库·开源·prometheus
Prometheus介绍(开源系统监控与告警工具)(时间序列数据库TSDB、标签化label-based多维分析、Pull模型、PromQL查询语言)在现代云原生架构中,监控已经成为保障系统稳定性和可观测性的核心能力。而在众多监控方案中,Prometheus 凭借其简单、强大和与 Kubernetes 的天然集成,成为事实上的标准。
yunson_Liu14 天前
prometheus
记一次logrotate.service处理过程报错告警内容 解决过程 1、查看硬盘空间是否充足2、查看logrotate日志3、手动运行以捕获即时错误 通过手动运行 logrotate 的调试模式,你可以直接在终端看到详细的错误输出:
TechWJ15 天前
ansible·prometheus
Ansible 跨千台机器批量部署,Node Exporter 监控实现 Prometheus 统一采集数据:一个 50 台服务器的小型集群,手动安装 Node Exporter 需要多少时间?保守估计,每台机器 10 分钟(包括 SSH 登录、下载、编译、配置、启动),500 分钟,也就是 8 小时 20 分钟。如果再考虑版本统一、权限控制、回滚机制这些细节,实际工时可能翻倍。