大数据分析案例

大数据分析案例

客户:医疗保健协会(Healthcare Association, U.S.)

解决方案目标

"我们需要一个可靠、快速且经济高效的 Hadoop 解决方案来应对我们的新数据计划。在概念验证中,NetApp 的 Hadoop 解决方案被证明比商用服务器方法更快、更可靠。 200TB 的概念验证进展顺利,我们已经开始朝着数据计划的目标取得进展。

NetApp 产品和服务

NetApp® E5560 storage array

• NetApp SANtricity®

NetApp FAS2540

• NetApp FAS3250 (Disaster Recovery)

• Clustered Data ONTAP®

环境

• 文件系统: Hortonworks Data Platform (Hadoop)

• 集群: 4 Hadoop DataNodes

• OS: RHEL 6.2

• 服务器平台: HP

• 数据存储: NetApp E5560

• NameNode 存储: FAS2540 and FAS3250

• Network: Brocade 5100 switches

• 协议: HDFS, SAS

客户介绍

医疗保健协会是一个全国性联合会,由众多独立的、以社区为基础的、当地经营的医疗保险公司组成。通过访问来自近 1.05 亿人的数据,该公司将强大的数据转化为丰富的见解和有意义的分析,从而改变美国医疗保健的交付和支付方式。

客户情况

为了加速医疗保健的智能化、数据化和可及性, 该组织启动了一项由三部分组成的项目,其中包括确定如何最好地使用公司和合作伙伴数据、评估分析数据的新功能以及使用数据洞察来提高客户保留率。

医疗保健协会选择了适用于 Hadoop 的 NetApp 解决方案来帮助释放数据的潜力。但是,对可靠性和可扩展性的担忧促使该公司在完全致力于解决方案之前请求概念验证 (POC)。

概念验证(POC)

NetApp 团队很快就确定了 200TB 的 POC。在 POC 期间,运行的性能和故障切换测试让客户对 NetApp Hadoop 解决方案充满信心。POC 还帮助客户更好地为在生产中运行的大量数据做好准备。

POC 测试结果

• 性能更好。NetApp E 系列解决方案在采集和 MapReduce 作业上的执行速度是内部驱动器的两倍。

• 可用性更高。与带有内置驱动器的白盒服务器相比,E 系列解决方案的停机时间更少。即使数据节点出现故障,服务在存储故障转移期间也不会中断。NameNode 恢复得更快。E 系列的一个关键优势是能够在群集运行时热插拔磁盘驱动器。

为什么选择 NetApp

提高效率

两个数据副本而不是三个(Hadoop 默认值)可减少所需的容量并加快应用程序性能,而不会影响数据可用性。

轻松部署

参考体系结构的模块化设计使添加节点和扩展变得简单,尤其是对于存储密集型工作负载。SANtricity 软件支持在存储保持在线的同时执行管理任务,因此可以在不中断的情况下进行配置更改、维护或存储容量扩展。

成本更低

与带有内部驱动器的白盒服务器的成本相比,客户有望在五年内节省 210万 美元的资本支出。

相关推荐
RestCloud1 小时前
iPaaS是什么?2026年企业集成平台从零到一完全指南
数据安全·api接口·ipaas·api治理·api管理·企业集成平台
高洁011 小时前
医疗行业的数字孪生革命
python·机器学习·数据挖掘·transformer·知识图谱
MATLAB代码顾问1 小时前
Python Pandas数据分析入门指南
python·数据分析·pandas
dog2504 小时前
信号权重和流分类的对数规律
人工智能·分类·数据挖掘
叫我:松哥4 小时前
基于Python的共享单车租赁数据分析与预测系统,技术栈flask+boostrap+随机森林+XGBoost
人工智能·python·深度学习·算法·随机森林·数据分析·flask
林间码客6 小时前
03(扩展)回归决策树(Regression Decision Tree)
决策树·数据挖掘·回归
wayz116 小时前
Momentum:UO(终极震荡指标)技术指标详解
算法·金融·数据分析·量化交易·特征工程
真上帝的左手7 小时前
19. 大数据-数据治理-数据标准
大数据·数据分析
MATLAB代码顾问7 小时前
Python数据分析项目实战:销售数据仪表盘
开发语言·python·数据分析
牛油果子哥q7 小时前
二叉树(Binary Tree)零基础精讲,树基础概念、树形分类、核心性质、递归/层序遍历、完整代码与面试考点全解
c++·面试·数据挖掘