大数据分析案例

大数据分析案例

客户:医疗保健协会(Healthcare Association, U.S.)

解决方案目标

"我们需要一个可靠、快速且经济高效的 Hadoop 解决方案来应对我们的新数据计划。在概念验证中,NetApp 的 Hadoop 解决方案被证明比商用服务器方法更快、更可靠。 200TB 的概念验证进展顺利,我们已经开始朝着数据计划的目标取得进展。

NetApp 产品和服务

NetApp® E5560 storage array

• NetApp SANtricity®

NetApp FAS2540

• NetApp FAS3250 (Disaster Recovery)

• Clustered Data ONTAP®

环境

• 文件系统: Hortonworks Data Platform (Hadoop)

• 集群: 4 Hadoop DataNodes

• OS: RHEL 6.2

• 服务器平台: HP

• 数据存储: NetApp E5560

• NameNode 存储: FAS2540 and FAS3250

• Network: Brocade 5100 switches

• 协议: HDFS, SAS

客户介绍

医疗保健协会是一个全国性联合会,由众多独立的、以社区为基础的、当地经营的医疗保险公司组成。通过访问来自近 1.05 亿人的数据,该公司将强大的数据转化为丰富的见解和有意义的分析,从而改变美国医疗保健的交付和支付方式。

客户情况

为了加速医疗保健的智能化、数据化和可及性, 该组织启动了一项由三部分组成的项目,其中包括确定如何最好地使用公司和合作伙伴数据、评估分析数据的新功能以及使用数据洞察来提高客户保留率。

医疗保健协会选择了适用于 Hadoop 的 NetApp 解决方案来帮助释放数据的潜力。但是,对可靠性和可扩展性的担忧促使该公司在完全致力于解决方案之前请求概念验证 (POC)。

概念验证(POC)

NetApp 团队很快就确定了 200TB 的 POC。在 POC 期间,运行的性能和故障切换测试让客户对 NetApp Hadoop 解决方案充满信心。POC 还帮助客户更好地为在生产中运行的大量数据做好准备。

POC 测试结果

• 性能更好。NetApp E 系列解决方案在采集和 MapReduce 作业上的执行速度是内部驱动器的两倍。

• 可用性更高。与带有内置驱动器的白盒服务器相比,E 系列解决方案的停机时间更少。即使数据节点出现故障,服务在存储故障转移期间也不会中断。NameNode 恢复得更快。E 系列的一个关键优势是能够在群集运行时热插拔磁盘驱动器。

为什么选择 NetApp

提高效率

两个数据副本而不是三个(Hadoop 默认值)可减少所需的容量并加快应用程序性能,而不会影响数据可用性。

轻松部署

参考体系结构的模块化设计使添加节点和扩展变得简单,尤其是对于存储密集型工作负载。SANtricity 软件支持在存储保持在线的同时执行管理任务,因此可以在不中断的情况下进行配置更改、维护或存储容量扩展。

成本更低

与带有内部驱动器的白盒服务器的成本相比,客户有望在五年内节省 210万 美元的资本支出。

相关推荐
大神薯条老师10 分钟前
Python从入门到高手5.1节-Python简单数据类型
爬虫·python·深度学习·机器学习·数据分析
搞大屏的小北 BI5 小时前
国内旅游:现状与未来趋势分析
信息可视化·数据分析·旅游·数据可视化·bi 工具
Hello.Reader6 小时前
TopK算法在大数据重复数据分析中的应用与挑战
大数据·算法·数据分析
安静的_显眼包O_o6 小时前
【数据分析】DataFrame.query()
数据挖掘·数据分析·pandas
技术无疆8 小时前
【Python】Streamlit:为数据科学与机器学习打造的简易应用框架
开发语言·人工智能·python·深度学习·神经网络·机器学习·数据挖掘
羊小猪~~8 小时前
机器学习/数据分析--用通俗语言讲解时间序列自回归(AR)模型,并用其预测天气,拟合度98%+
人工智能·python·机器学习·数据挖掘·数据分析·回归·时序数据库
凭栏落花侧14 小时前
决策树:简单易懂的预测模型
人工智能·算法·决策树·机器学习·信息可视化·数据挖掘·数据分析
wei_shuo15 小时前
偏标记学习+图像分类(论文复现)
学习·分类·数据挖掘
bin915316 小时前
【EXCEL数据处理】000010 案列 EXCEL文本型和常规型转换。使用的软件是微软的Excel操作的。处理数据的目的是让数据更直观的显示出来,方便查看。
大数据·数据库·信息可视化·数据挖掘·数据分析·excel·数据可视化
大神薯条老师1 天前
Python从入门到高手4.3节-掌握跳转控制语句
后端·爬虫·python·深度学习·机器学习·数据分析