在大数据时代:为何硬盘仍是数据中心存储的核心

在云计算和人工智能应用场景不断涌现的时代背景下,数据集的价值急剧上升,硬盘对于数据中心运营商来说变得比以往任何时候都更为关键。硬盘存储了全球大部分的艾字节(EB)数据,行业分析师预计,在艾字节持续增长的趋势中,硬盘将成为主要的受益者。这一情况在企业级和大型云数据中心中尤为突出,因为世界上大多数的数据集都存放于此。

多年以来,全闪存技术的支持者一直声称"硬盘很快将成为过去式"以及"未来的数据中心将是全闪存的"。然而,这些论断并未经得起时间的考验。不可否认,固态硬盘(SSD)是一项重要技术,非常适合需要实时数据传输的应用场景。但是,硬盘仍将继续作为数据中心艾字节存储的首选目的地。

一个时常被重新提起的误解是,唯有闪存技术能满足现代企业工作负载的性能需求。这种观点之后往往伴随着紧急呼吁,主张通过转向全闪存系统来"简化"并"为未来做好准备",以避免落后风险。实际上,企业存储架构需要不同类型的存储介质组合,以便针对特定工作负载的成本、容量和性能需求进行优化。全闪存、非此即彼的逻辑之所以不成立,原因有三:

  1. **多数现代工作负载并不需要闪存提供的性能优势**。全球大部分数据存于云端和大型数据中心中,这些环境中的工作负载遵循帕累托原则:只有一小部分工作负载需要消耗大量的性能资源。过去五年里,硬盘几乎占据了云服务提供商和超大规模数据中心存储安装基础的90%。

  2. **企业必须在容量、成本与性能之间取得平衡**。总拥有成本(TCO)考量是大多数数据中心基础设施决策的关键。这要求在成本、容量和性能之间找到平衡点。最优TCO是通过将最具成本效益的媒体(硬盘、闪存或磁带)与工作负载需求相匹配来实现的。对于大多数企业任务而言,硬盘仍然是最具成本效益的选择,其每TB成本比SSD低6倍,这使磁盘媒体成为数据中心存储基础设施中无可争议的基石。

  3. **单一层级存储架构的所谓简单性是在寻找并不存在的问题的解决方案**。许多混合存储系统采用了一种经过充分验证且精细调整的软件定义架构,该架构无缝集成并利用不同介质类型的优势,将其整合为统一的单元。在规模可扩展的私有或公共云数据中心架构中,文件系统或软件定义存储被用来跨数据中心位置和区域管理数据存储负载。它们提供了足够的灵活性,使企业能够根据不断变化的需求调整存储组成。

总之,云、超大规模及大型企业存储架构在选择存储方案时,会综合考虑成本、容量和性能的优化。硬盘服务于那些不适合由闪存处理的工作负载,而闪存则服务于不适合硬盘处理的工作负载。两种存储媒介将在数据中心中共存,且在可预见的未来,硬盘在存储艾字节数量上将持续占据主导地位。

相关推荐
Esaka_Forever1 分钟前
FAISS (Facebook AI Similarity Search)
人工智能·faiss
摄影图1 分钟前
[图片素材]大模型训练开发 场景覆盖适配各类科技
人工智能·科技·aigc·贴图
CSND7404 分钟前
零基础学Python合集---3:字符串的定义和常用方法
人工智能·python
数据堂官方账号5 分钟前
数据上新|覆盖全双工、具身智能、世界模型等热门研究趋势
人工智能·大模型·具身智能
保卫大狮兄6 分钟前
什么是物料编码?使用ERP之前做物料编码时需要注意什么?
大数据
LienJack14 分钟前
《Re0 Build Harness》第二章Agent 组成模型:Model、Loop、Tools、State
人工智能·agent
Raink老师17 分钟前
【AI面试临阵磨枪-087】Skill 生命周期:注册、加载、调度、熔断、卸载、版本管理?
人工智能·面试·职场和发展
夜郎king18 分钟前
告别创作卡壳!体验 CSDN AI 数字营销,解锁全新写作思路
人工智能·数字营销体验·ai 营销新体验
Luke Ewin23 分钟前
从零开始部署Fun-ASR-Nano实时语音识别并区分说话人教程 | 私有化部署开源的实时语音转写项目
人工智能·语音识别·funasr·实时语音识别·fun-asr
跨境技工小黎26 分钟前
Playwright vs Puppeteer :自动化脚本工具全面对比
人工智能