云原生

小猿姐10 小时前
运维·elasticsearch·云原生
唯品会大规模数据库云原生实践:基于 KubeBlocks 管理数千实例的统一运维之路在云原生时代,如何高效管理多种异构数据库引擎,一直是大型互联网企业面临的核心挑战。作为中国领先的特卖电商平台,唯品会(Vipshop) 的业务模式具有典型的瞬时高并发特征(如上新特卖期间)。这种业务形态对底层数据基础设施的弹性、稳定性和运维效率提出了极高的要求。
阿里云云原生21 小时前
云原生·agent
AgentTeams 和 Claude Tag 都进入群聊模式,是新范式还是新叙事?作者:望宸我们在今年的 520 阿里云云峰会上发布了 AgentTeams,定位的是企业级多智能体治理与协作平台,支持企业统一创建、调度 Agent,每个 Agent 可以自定义模型,在钉钉、企微、飞书等 IM 平台创建群聊,进行团队协作。
阿里云云原生2 天前
云原生
Higress v2.2.3 发布:正式入驻 CNCF Sandbox,AI Gateway 与 Ingress 迁移能力双向加固作者:如漫Higress 近期发布了 v2.2.3 版本,主仓库共 48 项更新、Higress Console 8 项更新。核心变化包括:
阿里云云原生3 天前
云原生·agent
香港站【企业 AI Agent 工程化实战专场】来啦,邀您7月9日见!当 AI Agent 开始全面重塑企业效率,真正的“工程化难题”也接踵而至:多个 Agent 如何协作与治理?模型与工具如何统一管控、安全合规?面对长任务与高并发时如何稳定运行?每一次 Agent 决策上线后,由谁把关、谁来解释?
阿里云云原生3 天前
云原生
研发域与运维域的“数字握手”:通过 Agentic Skills 实现 DevOps 全链路自动化6 月 25 日,阿里云飞天发布时刻发布阿里云 Skills 官网,以 Agent 为新的操作主体,重构云能力的统一调用入口。
阿里云云原生7 天前
云原生·ai编程
AI 开发新常态:当 Cursor、Claude、Codex 并行,如何统一管理散落的 Skill 资产?作者:刘鹏(墨松)当前 AI Coding 的发展正处在百花齐放的时代,没有永远的王者。模型越来越强,Cursor、Claude Code、Codex 轮番成为阶段性首选;再加上额度限制、响应延迟等现实问题,开发者早就习惯了“鸡蛋不放在一个篮子里”。
探索云原生7 天前
ai·云原生·kubernetes
K8s 1.36 这个 GA 特性,把 initContainer 拉模型的 hack 干掉了OCI 规范建立的目的就是将容器镜像格式标准化,正如其名,OCI 镜像在之前一直用来跑容器,但现在它还能干更多事。
Java之美7 天前
云原生
从edge-trigger到level-trigger,谈谈 Kubernetes controller 的开发范式很多人是从 kubebuilder 的脚手架开始接触 controller 的:kubebuilder init、create api,一个 Reconcile 函数就摆在你面前,照着填就能跑。但填着填着就会冒出一堆问号——为什么 Reconcile 不告诉我"发生了什么事件"?为什么要写得幂等?Finalizer 到底在防什么?
阿里云云原生8 天前
云原生
深度解构:当 Append-only 的 SLS 遇上 Update/Delete,是如何实现设计权衡的?作者:无哲引言:我们是阿里云日志服务 SLS 团队。SLS 是阿里云上的一站式日志与可观测平台,每天承载着海量企业日志的采集、存储、查询、分析与投递。过去十几年里,写入 LogStore 的日志一直都是不可变的。但最近,我们给它加上了对已有数据的原生 update 和 delete 能力。今天想借这篇文章,聊聊我们为什么要做这件事,以及背后的设计取舍。
Java之美8 天前
云原生·kubernetes
一次k8s升级引发的DevicePlugin注册失败最近把一个 Kubernetes 集群从旧版本升级到了新版本,集群里跑着一个自研的 device plugin(以 DaemonSet 形式部署)。升级前一切正常,升级后这个 DaemonSet 一启动就疯狂报错:
秋播8 天前
云原生
nerdctl推送rancher本地镜像到harbor因为外网拉取镜像你懂的,非常慢,所以考虑将常用rancher镜像放到本地镜像库为什么要安装这个工具,原因在于:
阿里云云原生9 天前
云原生·kafka
告别冗长链路!Kafka × Table Bucket 实现开放表格式零 ETL 实时入湖作者:阿里云消息团队摘要:在 AI 驱动的数据应用场景中,企业越来越需要一套同时支撑实时消费、历史沉淀与多引擎复用的数据底座。Kafka、Iceberg 开放表格式与对象存储的组合,正成为流数据入湖的重要方向。但传统依赖 Flink、Spark 等外部 ETL 作业的方式,也带来了链路长、系统边界多、运维复杂等问题。本文围绕“零 ETL”这一趋势,讨论流数据入湖为什么需要做架构减法,并结合 Kafka × Table Bucket 的实践,分析一种将通用入湖能力前移到消息与表存储链路中的方案,如何在降低复
SelectDB10 天前
大数据·后端·云原生
秒级弹性、最高降本 70%:SelectDB Serverless 如何重塑云数仓资源效率过去十年,数仓从"上云"走向"云原生"。然而在资源管理层面,一个根本性矛盾依然存在:业务负载具有波动性,而资源规格通常只能依据峰值提前锁定。
秋播12 天前
云原生
国内本地WSL2编译rancher源码a. 在.wslconfig 文件中配置如下:b. 打开hyper-v管理器创建虚拟交换机,绑定本地的可上网网卡即可。新生成的桥的ip地址和无线网卡处于同一网段如图
小猿姐14 天前
mysql·云原生·aiops
MySQL Top 10 热点问题 AI 运维实战:从内核诊断到云原生运维一条业务请求连接 MySQL 很慢,问题可能不是网络,而是连接和线程已经堆起来了。一笔订单更新卡住了,问题可能不是应用代码,而是数据库里有事务正在持锁。
阿里云云原生15 天前
云原生
深入内核:拆解 OpenTelemetry eBPF 探针如何优雅地“透视”多语言微服务?作者:古琦在云原生与微服务架构下,一套生产系统往往横跨 Go、Java、Python、Node.js 等多种语言运行时,部署形态又散落在容器、Kubernetes、Serverless 之间。要在这样的异构环境里建立统一的可观测性,传统做法是为每种语言挂载侵入式 Agent 或 SDK——改代码、装包、对齐版本、重新发布,每接入一个新服务都是一次工程项目。在快速迭代的研发节奏下,这种“接入即改造”的成本越来越难以承受。
java_cj15 天前
linux·运维·服务器·云原生·容器·kubernetes
深入kube-apiserver认证机制:从Bearer Token到mTLS的完整认证链解析去年处理过一次安全事件:攻击者通过某个泄露的服务账号token,成功连接到了我们的K8s集群并创建了恶意Pod。事后复盘时,我发现自己对K8s的认证机制理解太浅——只知道用kubectl配置token,却不清楚认证是如何进行的、有哪些防护手段。
互联网推荐官15 天前
云原生·云计算·paas·软件开发·开发经验·上海
上海软件定制开发公司推荐:从PaaS工程化路径看D-coding的技术取舍在讨论“上海软件定制开发公司哪家好”时,企业真正需要比较的并不只是报价、工期和页面效果,而是交付后的系统能否持续迭代、能否接入原有业务、能否在多端环境下保持一致体验。D-coding作为上海本地的软件开发PaaS云平台,其价值更适合放在工程路径里观察:它不是简单把需求外包给开发人员逐项编码,而是通过平台化能力把页面、数据、逻辑、接口、运维和后续升级纳入同一套技术体系。
sbjdhjd15 天前
git·servlet·ci/cd·云原生·云计算·gitlab·jenkins
从零搭建企业级 CI/CD(下):Jenkins+GitLab+Harbor 全链路实战指南Jenkins是开源CI&CD软件领导者, 提供超过1000个插件来支持构建、部署、自动化, 满足任何项目的需要。
java_cj16 天前
运维·云原生·容器·kubernetes
深入kubectl create源码:从YAML到Pod的完整链路拆解有次帮同事排查问题,他的YAML文件里有3个资源(Deployment、Service、ConfigMap),执行kubectl create -f app.yaml后只成功创建了2个,Service死活创建不了,报错说已存在。但kubectl get svc一看,根本没有同名的Service!