解锁SAP数据的潜力:SNP Glue与SAP Datasphere的协同作用

在各种文章中,我们研究了客户如何利用SNP Glue与基于云的数据仓库和数据湖相结合,以充分利用其SAP数据。SNP Glue 通过高性能集成解决方案帮助客户解锁 SAP 数据孤岛。例如,可以使用SNP Glue先进的增量捕获(CDC)近乎实时地将SAP数据近乎实时的流式传输到基于云的数据平台。

现在,大多数客户都在询问与基于云的数据仓库的集成,这些数据仓库通常来自Hyperscalers和Snowflake。但是,这可能有点短视。在处理SAP数据时,一定要看看SAP本身提供了什么。随着数据仓库云 (DWC)在2023 年重新融入具有新功能的数据领域,有一个非常有趣的产品值得更多关注-Datasphere。

在比较解决方案时,可能会有一些短见的原因,毕竟不幸的是,SAP已经设法传播了关于报告和数据仓库的混淆,甚至在SAP HANA的早期,Hasso Plattner自己告诉客户,使用HANA,您将不再需要SAP BW(顺便说一句,有人记得HANA Vora是如何适应这种情况的吗?)

如今,SAP BW (BW/4HANA)发展强劲,SAP已经在某种程度上转型为一家云公司(显然,许多客户需要时间来转型,当涉及到他们的核心业务系统时,他们仍然遵循陈旧的内部部署策略)。考虑到这一点,让我们来看看SAP在数据仓库和报告方面的云功能!

几年前,SAP引入了DWC,即数据仓库云。在新版本中,SAP将其扩展到Datasphere产品中。这不仅仅是一个经过改进的SAP BW,而是一个更加现代化和雄心勃勃的发展。例如,SAP BW的传统弱点之一一直是在就业市场上很难找到真正实施它的人才。原因是您需要一个独特的业务知识、数据知识和使用SAP自己的编程语言ABAP进行编码的概要文件。如果没有这种组合,您的实施就无法在将数据建模和数据转换方面适应您自己的业务。

使用SAP的Datasphere,您可以使用数据科学家所选择的语言Python------来实现这些转换。这显然更加现代和可扩展。即使一些ABAP老手也希望看到Python编译器集成到Netweaver ABAP堆栈中,作为ABAP引擎的辅助工具,说到这里,也许Walldorf的某个人会读到这篇文章并开始。

Datasphere提供了您对现代数据仓库的期望:数据存储、数据目录功能,甚至为员工提供数据自助服务。它提供了到其他云或本地资源的多个连接器。但更重要的是那些来自"SAP"类别的产品,客户有很多选择。它提供了从ABAP类型的连接、BW或BW4模型到S4/HANA云产品的所有功能。除了连接中可用的常见"拉取"方法外,第三方ETL工具还可以利用Open SQL模式将数据直接写入Datasphere租户中的数据层。

Datasphere使用SAP自己的HANA内存数据库,它基于列,保证了出色的报告性能。使用现代硬件,内存和存储方面的传统限制不再是真正的问题,显然,仅使用来自ERP的业务数据,无论如何都不会构建数百TB的数据湖。在这方面,出色的性能与SAP HANA特性(如数据联合(HANA视图))相结合显然更为重要。

不过,SAP Datasphere并不打算成为最终的数据消费平台。它依赖于SAP分析云(SAC)或其他第三方前端技术。整个体系结构如下图所示。

与传统SAP BW非常不同的关键功能之一是数据市场,它允许您利用云的真正力量。它适用于三个用例:

内部数据共享

这允许您重新考虑数据仓库策略。组织的每个部分都可以作为单独的数据创建者和提供者(例如,财务、营销和采购等),并可以决定共享哪些数据以及如何共享。数据共享的整个过程是分散的,因此更加灵活。从成本控制的角度看分配成本也容易得多。同样的概念也适用于私有和公共数据共享。

私有数据共享

您可以轻松地与子公司或总部共享您的数据,就像您在内部共享数据一样。再次以优雅的方式处理了难题,同时确保了简单性、安全性和合规性。

公共数据共享

更重要的是,有来自100多个数据提供商的3000多种数据产品,这些产品可以很容易地使用,天气数据、股票市场信息或人口统计数据只需点击一下。是的,理论上你甚至可以把你的数据出售给其他公司。

为了简化和加速向Datasphere的实现和过渡,SAP拥有"Datasphere, BW Bridge"。客户可以使用该技术逐步从现有的SAP BW解决方案迁移到Datasphere。SAP承诺重用SAP BW数据模型、定制和范围内多达80%的SAP BW对象的数据。显然,BW InfoProviders的一些外来的或遗留的数据类型不会自动迁移,但是SAP BW客户最终还是需要对这些数据类型进行整理和"翻新"。

从技术上讲,BW Bridge运行在独立的云租户中,但与Datasphere租户共享数据。BW Bridge建立在SAP BW/4HANA之上(但功能略有改变),位于传统BW系统和云解决方案之间。您可以将其用作迁移和转换期间的暂存和传递。通过将其集成到SAP的BTP云解决方案中,这不仅是SAP的后续迁移,而且还为客户提供了两个重要的好处:

■ 它允许在过渡期间使用SAP ABAP。

■ 它可以为客户提供一个非常酷的选择来测试SAP BTP及其独特的功能。

不过,这里有几点需要注意。首先,BW Bridge将消耗额外的"容量单位"(CU),即SAP云货币。与所有云提供商一样,基于消费的应用程序的定价可能有点棘手,因为在使用它们之前,您不知道自己实际会消费多少。其次,BW Bridge是基于SAP业务仓库的,但是您将无法运行查询。Bridge只能执行老SAP BW的数据管理功能。此外,BW Bridge只能处理ODP连接器。虽然这在某种程度上是有意义的,但这意味着甚至不可能摄取文件。

现在,从SNP的角度来看,一个明显的问题是:SNP Glue如何适应这幅图?在很多情况下,Glue 在过渡中非常有帮助,但在这项技术的日常操作中也是如此:

■ 您可以使用SNP Glue以"one hop"的方式将SAP BW历史数据从传统SAP BW系统(甚至多个BW系统)一次性迁移到Datasphere。

■ 更重要的是,您可以使用SNP Glue从基于SAP Netweaver的系统或SAP的云解决方案中提取数据,并在持续的基础上将数据流式传输到Datasphere。这就是我们所说的"one hop"场景。在某种程度上,这种方案可以帮助客户在不需要BW Bridge作为"中间人"的情况下进行转换。

■ 对于非sap数据源也是如此。例如,您可以将来自Salesforce的数据流式传输到Datasphere,以构建报表和数据科学场景,其中包括来自各种解决方案甚至外部数据源的异构数据。

■ 在"double hop"方案中,客户可以利用 Datasphere 收集、处理、过滤、丰富 SAP 业务数据,并将结果传递到基于Hyperscaler、新兴技术(如Snowflake)或经过验证的大数据数据平台(如Cloudera (CDP))的更全球化的数据湖。这种数据湖的一个例子是将资产和工厂维护数据与非sap数据源(如传感器数据源)混合,以实现预测性维护方案。

有了SNP Glue,客户可以选择在他们的SAP Netweaver系统上将其作为一个纯SAP插件运行,也可以选择新的SNP Glue云功能,该功能目前正在与试点客户进行逐步提升。

最后,SAP没有提供将冷数据存储(例如NLS)迁移到新的基于云的世界的解决方案。SNP的Outboard套件涵盖了SAP ERP和BW的数据管理和归档,可以将这些归档数据公开给任何数据湖或数据仓库技术,无论是SAP自己的Datasphere还是任何其他(可能更便宜的)云存储甚至SQL数据库。

相关推荐
processflow流程图18 分钟前
分布式kettle调度平台v6.4.0新功能介绍
分布式
在下不上天19 分钟前
Flume日志采集系统的部署,实现flume负载均衡,flume故障恢复
大数据·开发语言·python
全栈开发圈27 分钟前
干货分享|分布式数据科学工具 Xorbits 的使用
分布式
智慧化智能化数字化方案1 小时前
华为IPD流程管理体系L1至L5最佳实践-解读
大数据·华为
PersistJiao2 小时前
在 Spark RDD 中,sortBy 和 top 算子的各自适用场景
大数据·spark·top·sortby
2301_811274312 小时前
大数据基于Spring Boot的化妆品推荐系统的设计与实现
大数据·spring boot·后端
Yz98762 小时前
hive的存储格式
大数据·数据库·数据仓库·hive·hadoop·数据库开发
青云交2 小时前
大数据新视界 -- 大数据大厂之 Hive 数据导入:多源数据集成的策略与实战(上)(3/ 30)
大数据·数据清洗·电商数据·数据整合·hive 数据导入·多源数据·影视娱乐数据
lzhlizihang2 小时前
python如何使用spark操作hive
hive·python·spark
武子康2 小时前
大数据-230 离线数仓 - ODS层的构建 Hive处理 UDF 与 SerDe 处理 与 当前总结
java·大数据·数据仓库·hive·hadoop·sql·hdfs