aws

yyuuuzz13 小时前
运维·服务器·网络·数据库·aws
国外云服务使用的常见技术问题梳理我之前帮一个做独立开发的朋友排查过一个奇怪问题:他把自己做的小工具服务放到国外云服务上,本地测试访问速度没问题,上线半个月后,越来越多用户反馈打开慢,偶尔还会出现网络连通性异常。他查了服务本身的CPU、内存占用,都没到瓶颈,带宽也没跑满,折腾了一周才找到问题根源——跨境链路的高峰期波动。很多普通开发者第一次接触国外云服务,都会有类似的误区:觉得云服务都是一样的,只要能开实例就能部署,没什么特别要注意的。其实不是,国外云服务的使用场景和需要注意的技术点,和境内的有不少区别。
光于前裕于后2 天前
云计算·etl·aws
AWS Redshift 集成Zero-ETL和数据共享 Data sharingAWS Data Sharing(数据共享):Redshift 原生功能,允许跨集群、跨账户以只读方式访问数据,数据不会被物理复制,消费方直接查询提供方的存储。 Zero-ETL:AWS 托管的实时同步管道,将 Aurora、DynamoDB、RDS 等 OLTP 数据库的变更自动持续同步到 Redshift,消除手写 ETL 代码。 结合的核心优势
zhojiew3 天前
云计算·aws
在AWS中国区实现EKS跨VPC跨区域实现节点加入集群的实践本文档记录了在 AWS 中国区实现 EKS 跨区域节点加入的完整过程,包括:创建 Access Entry:
认真的薛薛3 天前
ssh·aws·terraform
Terraform: AWS VPC+可SSH登录EC2这是上一章节纯VPC网络架构的实战验证版,在原有网络底座基础上新增了安全控制和计算资源,最终实现:一键部署完整VPC网络 + 一台可通过SSH密钥安全登录的公网EC2实例,用于验证整个网络架构的连通性。
认真的薛薛3 天前
云原生·aws·terraform
Terraform:AWS VPC这是一个生产级标准的AWS双可用区VPC网络架构,也是AWS上部署任何应用的基础网络底座。我会从架构原理、代码逐行解析、流量走向、最佳实践、常见坑点五个维度进行全面讲解,让你不仅能看懂代码,还能理解"为什么这么写"。
yyuuuzz4 天前
运维·服务器·网络·aws
境外云服务器使用常见问题梳理我之前帮一个做跨境业务的开发者排查过服务稳定性问题,他把面向境内用户的主业务放在了境外云服务器,面向海外用户的反而放在境内,跑了快一个月,一直说用户抱怨加载慢,没找到问题出在哪。很多人第一次接触境外云服务器的时候,大多只关注位置在境外这一个特点,对背后隐藏的技术差异、场景适配要求没有做太多思考,最后踩了坑才回头调整架构,浪费了不少时间。
zhojiew5 天前
运维·hbase·aws
使用Redis Stream订阅HUATUO发布SSE内核可观测性事件并进行AI分析的数据管道实践在现代云原生环境中,内核级故障往往是生产事故中最棘手的一类,它们隐蔽、突然、且灾难性。本项目在单台 EC2 实例上构建了一套完整的内核可观测性 AI 分析管道,将 eBPF 深度内核追踪、事件流管道、规则引擎与大语言模型诊断能力融为一体。
yyuuuzz7 天前
运维·服务器·网络·安全·web安全·云计算·aws
谷歌云使用的几个常见注意事项我之前帮一位初学后端的朋友排查过一次服务异常问题,他把本地跑通的web服务搬到了谷歌云上,结果启动之后始终无法正常访问,翻了好几份中文教程都没找到问题,折腾了快三个小时才来找我。我登上去看了不到十分钟就找到了原因,其实就是一个非常基础的配置漏项,很多第一次接触的人都会在这里踩坑。
zhojiew7 天前
运维·hbase·aws
在AWS中国区的EMR集群中实现基于向量语义搜索的HBase运维诊断系统HBase 作为大规模分布式数据库,其日志分散在 Master 和多个 RegionServer 节点上。当集群出现异常时,运维人员需要:
yyuuuzz8 天前
运维·服务器·网络·云计算·aws
独立开发者线上服务运维的几点实践经验我之前帮几个朋友排查线上问题,其中有三位都是独立开发者,遇到的问题大同小异,大多是没人盯服务,出问题过了半天才发现,或者资源没规划好,突然流量上来就把服务打挂了。很多人对独立开发者的印象还停留在“一个人写完全部产品代码”,实际上从部署到运维到容灾,全要自己扛,这里面的技术细节其实不少。
zhojiew8 天前
云计算·aws
使用DBT(data build tool)集成AWS Athena完成数据处理的实践dbt(data build tool)是一个开源的数据转换框架,定位在 ELT(Extract-Load-Transform)架构中的 Transform,即数据已经被提取并加载到数据平台后,由 dbt 负责在平台内部完成转换逻辑。与传统 ETL 中用 Python/Java 在外部编排转换不同,dbt 让分析工程师直接用 SQL + YAML 定义转换规则,由 dbt 编译后在目标引擎上执行。
yyuuuzz9 天前
运维·服务器·网络·云计算·aws
aws的核心概念与常见使用场景前阵子帮刚换工作的师弟梳理新项目的技术栈,整个后端环境都跑在aws上,他说之前只听过这个名字,具体能做什么、该注意什么完全没概念。问了几个刚工作两三年的开发者,发现不少人对aws的认知还停留在“国外云服务”的模糊标签里,具体的核心能力和适用场景其实说不清楚,甚至有人把它和单纯的存储服务搞混,以为只能用来存数据,其实完全不是这么回事。
zhojiew9 天前
云计算·aws
在AWS云上使用EC2 嵌套虚拟化实例部署Cube Sandbox的实践和问题如果要在EC2实例上测试microvm类型的sandbox,需要使用bare metal 实例才支持 KVM/Hyper-V。近期AWS 宣布虚拟 EC2 实例支持嵌套虚拟化,现在一台8系列就能跑 KVM。本文档记录了在 AWS EC2 嵌套虚拟化环境(c8i.2xlarge)部署 Cube Sandbox 的完整过程。
yyuuuzz11 天前
运维·服务器·网络·数据库·云计算·aws
国际云服务器的技术特点与使用经验我之前帮朋友排查过一次访问卡顿的问题,最开始大家都把问题方向指向业务代码的性能不足,折腾了将近两天,改了好几版优化,又查了数据库索引,问题还是没解决。最后拉了链路测试才发现,问题根源出在对国际云服务器的网络特性理解不对——他们把面向欧洲用户的服务放在了东南亚节点,又没做任何路由优化,自然访问体验很差。很多开发者第一次接触国际云服务器的时候,都会有类似的认知偏差,要么把它想得太特殊,要么又完全不注意它和国内节点的差异,我整理了一些实际接触下来的经验。
我是小邵12 天前
架构·云计算·aws
从 Supabase 迁移到 AWS 的云架构演进实践前言 在现代应用架构中,很多团队会从快速开发的 Backend-as-a-Service(BaaS)逐步迁移到更可控的云原生架构。 Supabase 提供了一体化后端能力,而 Amazon Web Services 则提供模块化云基础设施。 这类迁移的本质不是“换服务”,而是一次架构拆解与云能力重组。
炸裂狸花猫12 天前
阿里云·云原生·keycloak·aws·oci·sso
开源身份认证与访问管理平台 - Keycloak(三)公有云Console集成实践(AWS / 阿里云 / OCI)目录简介十一、SAML集成原理11.1 为什么公有云使用SAML11.2 SAML认证流程十二、AWS集成
xixixi7777712 天前
人工智能·安全·ai·大模型·云计算·aws
AI的“账号”与“钱包”:AWS与Circle同日出手,AI正从工具进化2026年5月11日,两个看似无关的事件在同一天发生:AWS让Claude融入企业IAM控制面,Circle为AI Agent装上原生加密钱包。一个解决“AI归谁管”,一个解决“AI怎么付”。当“账号”与“钱包”同时到位,AI正式从人类的附属工具,进化为可管理、可交易的经济实体。
China_Yanhy13 天前
人工智能·云原生·aws
【云原生 AI 实战(二)】大模型训练的“深水区”:从 Pod 成功拉起到 GPU 性能监控与模型导出标签:AWS EKS PyTorch 性能调优 SageMaker HyperPod大家好,我是 [锅巴王子]。在上一篇文章中,我们通过编写极其硬核的 PyTorchJob YAML,配合 EFA 极速网卡,成功在 EKS 上拉起了 2 台包含 16 张 A100 显卡的物理节点,并且 Pod 状态已经绿油油地显示为 Running。
翼龙云_cloud13 天前
人工智能·云计算·aws·ai智能体·deepseek v4
亚马逊云代理商:DeepSeek V4海外使用指南 AWS部署方案海外企业与开发者想用上DeepSeek V4 百万上下文能力,又担心数据合规、访问延迟与部署成本?作为国产大模型出海标杆,DeepSeek V4 不仅提供OpenAI 兼容 API快速接入,更支持AWS 全栈私有化部署,兼顾低延迟、高安全与低成本,是海外跨境、科研、企业服务场景的最优解。本文从海外接入方式、AWS 部署选型、实操步骤到成本优化,帮你快速上手。
因_果_律14 天前
ai·云计算·aws
Claude Platform on AWS 的四大亮点功能同样是在 AWS 上跑 Claude,Claude Platform 和 Amazon Bedrock 其实是两套完全不同的东西。