云计算

tiancaijiben2 小时前
云计算
阿里云Kubernetes集群托管完全指南:从创建到生产级运维在开始对接使用阿里云Kubernetes集群托管服务之前,首先需要理解ACK提供的不同集群类型及其适用场景。阿里云容器服务Kubernetes版(ACK)目前主要提供两种集群形态:ACK托管集群和ACK专有集群。
互联网推荐官7 小时前
云原生·云计算·paas·软件开发·开发经验·上海
上海软件定制开发公司推荐:从PaaS工程化路径看D-coding的技术取舍在讨论“上海软件定制开发公司哪家好”时,企业真正需要比较的并不只是报价、工期和页面效果,而是交付后的系统能否持续迭代、能否接入原有业务、能否在多端环境下保持一致体验。D-coding作为上海本地的软件开发PaaS云平台,其价值更适合放在工程路径里观察:它不是简单把需求外包给开发人员逐项编码,而是通过平台化能力把页面、数据、逻辑、接口、运维和后续升级纳入同一套技术体系。
sbjdhjd7 小时前
git·servlet·ci/cd·云原生·云计算·gitlab·jenkins
从零搭建企业级 CI/CD(下):Jenkins+GitLab+Harbor 全链路实战指南Jenkins是开源CI&CD软件领导者, 提供超过1000个插件来支持构建、部署、自动化, 满足任何项目的需要。
tiancaijiben7 小时前
云计算
阿里云应用实时监控服务ARMS完全接入指南:从探针部署到全链路可观测应用实时监控服务ARMS是阿里云推出的一站式全栈可观测平台,覆盖浏览器、小程序、APP、分布式应用、容器等不同可观测环境与场景。ARMS包含用户体验监控、应用监控、可观测链路OpenTelemetry版等模块,满足不同语言、架构、部署环境的应用性能观测需求。其核心价值在于通过模块化、即插即用的设计,帮助企业快速构建全栈可观测平台。
xingyuzhisuan19 小时前
大数据·云计算·gpu算力
算力租赁平台 GPU 资源隔离方案:显存抢占问题深度排查与解决随着算力租赁行业规模化发展,单台 GPU 服务器面向多租户共享使用成为主流部署模式。在未做精细化资源隔离的环境中,租户进程无序占用显存、显存溢出、进程互相抢占资源等问题频发。实测数据显示,无隔离策略的共享节点,显存抢占故障发生率可达 27%,直接造成任务中断、推理延迟上升 40% 以上,GPU 整体利用率从 88% 降至 59%。
workbuddy小能手1 天前
架构·云计算·腾讯云
腾讯云ADP Agent Portal vs 自建智能体:架构选型对比随着大语言模型(LLM)在企业场景中的深入应用,智能体(Agent)架构逐渐成为技术选型的热点。企业在构建AI应用时,面临一个核心抉择:是使用腾讯云ADP Agent Portal这样的托管平台,还是基于开源框架自建智能体系统?
宸津-代码粉碎机1 天前
java·大数据·人工智能·后端·python·spring·云计算
Spring AI 企业级实战|智能记忆摘要+自动遗忘机制落地,彻底解决上下文爆炸与Token冗余�� Spring AI 商用Agent 系列专栏(续篇)在上一篇文章中,我们基于 JdbcChatMemory 实现了对话记忆持久化,解决了服务重启、会话刷新导致的AI失忆问题,完成了Spring AI Agent记忆能力的基础商用落地。
tiancaijiben1 天前
云计算
阿里云Elasticsearch搭建网站站内搜索功能:从零到生产级实战指南当用户在你的网站上输入关键词进行搜索时,如果后台直接使用MySQL的LIKE %keyword%进行模糊匹配,随着数据量增长到百万甚至千万级,查询响应时间会从几百毫秒飙升到几秒甚至几十秒。更致命的是,传统关系型数据库无法理解相关性概念——同样是搜索苹果手机,数据库会把苹果水果和手机产品混在一起,无法将手机类的商品优先展示在前。这就是需要引入专用搜索引擎的根本原因。
tiancaijiben1 天前
云计算
阿里云Linux云服务器搭建Joomla基础管理平台:从零到企业级部署Joomla是一款基于PHP语言和MySQL数据库开发的免费开源内容管理系统,在全球范围内拥有庞大的用户基础和活跃的开发者社区。与WordPress主打博客和简单网站不同,Joomla在企业级网站构建方面展现出更强的灵活性和扩展能力。它基于模型-视图-控制器架构构建,这种设计模式使得开发者可以轻松定制和扩展现有功能,甚至完全脱离CMS核心独立构建强大的Web应用。在众多CMS中,Joomla最突出的优势之一是其强大的多语言支持体系。它内置了完善的语言包管理机制,不仅可以轻松创建多语言网站内容,还能将管理后
翼龙云_cloud1 天前
运维·阿里云·云计算·阿里云 cpfs
阿里云代理商:如何管理CPFS的POSIX客户端挂载点?阿里云 CPFS 通用版是 AI 训练、HPC 高性能计算的首选并行文件存储,POSIX 挂载是发挥其高吞吐、低延迟、多节点共享能力的核心方式。本文用轻量化、易上手的方式,带你完整掌握添加、查看、删除POSIX 客户端挂载点,让高性能存储访问更稳、更安全、更易管理。
xingyuzhisuan1 天前
运维·服务器·云计算·gpu算力
8 卡 / 16 卡 GPU 服务器机架布线与高速互联带宽优化技术详解2026 年,大模型训练、超算仿真等场景推动 8 卡 / 16 卡 GPU 服务器成为算力集群主流部署形态。高密度部署下,机架布线规范性、高速互联带宽分配直接决定集群算力利用率与训练效率。实测数据显示,布线混乱可导致信号衰减 15%-25%,互联带宽分配不合理会造成 GPU 间通信延迟增加 300%,算力利用率从 92% 降至 65% 以下。
tiancaijiben1 天前
云计算
阿里云云消息队列RabbitMQ版配置流程:从实例创建到消息收发全解析在分布式系统架构中,消息队列作为解耦、削峰填谷、异步通信的核心组件,已经渗透到订单处理、日志采集、实时通知、数据同步等几乎每一个业务场景。开源RabbitMQ凭借其轻量、稳定、功能丰富以及出色的社区生态,成为消息中间件领域最受欢迎的解决方案之一。然而,自建RabbitMQ集群往往面临着运维复杂度高、脑裂风险、消息积压导致的内存泄漏、弹性扩容困难等一系列稳定性痛点。
黄狗操作员2 天前
语言模型·云计算·运维开发·gpu算力
NCCL 2.29 官方文档参数解读Broadcast属于1对多的通信原语,一个数据发送者,多个数据接收者,可以在集群内把一个节点自身的数据广播到其他节点上。如下图所示,圈圈表示集群中的训练加速卡节点,相同的颜色的小方块则代表相同的数据。当主节点 0 执行Broadcast时,数据即从主节点0被广播至其他节点。
悠悠121382 天前
云计算·aws·devops
AWS DevOps Agent 体验一周后,我决定把 oncall 手机调成静音了上周三凌晨两点,我被一个 EKS 集群的告警叫醒。Pod 在 CrashLoopBackOff,CloudWatch 一片红。我迷迷糊糊打开笔记本,正准备 kubectl describe 的时候突然想起来——等等,我不是接了 AWS DevOps Agent 吗?
李小白662 天前
运维·云计算
第五天-计算机硬件存储单位转换两位计算机之父: 冯诺依曼,阿兰图灵(图灵奖) 摩尔定律: 每隔1.5年,集成电路的集成密度会翻一倍
yyuuuzz2 天前
大数据·运维·服务器·游戏·云计算·aws
游戏云服务器推荐的技术选择思路普通的网站服务器,大部分是短连接请求,用户打开网页拿到数据就断开连接,负载波动大但平均负载低,对延迟的容忍度也比较高,几秒钟加载完成用户大多能接受。但游戏服务不一样,几乎所有联网游戏都是长连接模式,从用户进入服务器到退出,连接一直保持,还要源源不断同步玩家位置、动作、游戏状态这些数据,对延迟和丢包的容忍度极低。哪怕只有几十毫秒的突发波动,在需要快速操作的游戏里,都会直接影响体验,要是直接掉线,对玩家的打击更大。这一点,很多游戏云服务器推荐的内容里不会特意强调,新手很容易直接忽略。有些情况下,不同运营商之间
tiancaijiben2 天前
云计算
阿里云音视频通信RTC全栈对接指南:从架构原理到多端集成实战阿里云实时音视频通信RTC是一套托管的云服务,旨在帮助开发者快速构建低延迟、高并发的实时音视频应用。其核心价值在于将复杂的网络传输、音视频编解码、弱网对抗等底层技术封装为易用的SDK与API,让开发者专注业务创新。
tiancaijiben2 天前
云计算
阿里云RDS PostgreSQL全方位对接使用指南与SQL语法深度解析阿里云RDS PostgreSQL是一款完全兼容开源PostgreSQL的云端关系型数据库服务,基于阿里云分布式文件系统和ESSD云盘高性能存储构建。它在完美支持事务、子查询、MVCC多版本并发控制、数据完整性检查等标准功能的基础上,额外集成了高可用架构、自动备份恢复、智能监控告警、一键迁移等企业级特性,显著降低了数据库的运维负担。
深圳市晶科鑫实业有限公司2 天前
服务器·人工智能·单片机·物联网·车载系统·云计算·信息与通信
AI服务器为何对低抖动差分晶振如此挑剔?随着大模型与人工智能(AI)算力的爆发式增长,AI服务器、NVLink高速互联以及万兆光模块的需求迎来了前所未有的井喷。在这场算力军备竞赛中,人们往往将目光聚焦在GPU、TPU和HBM显存等核心芯片上。然而,在动辄数百G甚至上T的数据吞吐网络背后,有一个默默无闻却决定全局成败的“隐形功臣”——差分晶振。