大数据处理

青云交1 个月前
数据库·内存管理·apache hive·数据集成·大数据处理·datafusion·查询处理·powercenter
大数据新视界 --大数据大厂之 DataFusion:超越传统的大数据集成与处理创新工具💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。💖💖💖
青云交2 个月前
数据库·kubernetes·容器编排·资源管理·大数据处理·扩展性、故障恢复·存储持久化·监控、日志管理、性能提升
大数据新视界 --大数据大厂之Kubernetes与大数据:容器化部署的最佳实践💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。💖💖💖
Trouvaille ~2 个月前
python·机器学习·数学建模·数据分析·numpy·科学计算·大数据处理
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧NumPy,即Numerical Python,是Python中最为常用的科学计算库之一。它提供了强大的多维数组对象ndarray,并支持大量的数学函数和操作。与Python内置的列表相比,NumPy数组的计算速度更快,占用内存更少,非常适合处理大量的数据。
贪钱算法还我头发7 个月前
python·pandas·pyspark·大数据处理
【小贪】大数据处理:Pyspark, Pandas对比及常用语法近期致力于总结科研或者工作中用到的主要技术栈,从技术原理到常用语法,这次查缺补漏当作我的小百科。主要技术包括:
架构成长指南8 个月前
datax·数据同步·数据库中间件·大数据处理
什么是数据同步利器DataX,如何使用?转载至我的博客 https://www.infrastack.cn ,公众号:架构成长指南今天给大家分享一个阿里开源的数据同步工具DataX,在Github拥有14.8k的star,非常受欢迎,官网地址:https://github.com/alibaba/DataX
架构成长指南9 个月前
doris·实时数仓·分库分表·大数据处理
基于Doris构建亿级数据实时数据分析系统转载至我的博客 https://www.infrastack.cn ,公众号:架构成长指南随着公司业务快速发展,对业务数据进行增长分析的需求越来越迫切,与此同时我们的业务数据量也在快速激增、每天的数据新增量大概在30w 左右,一年就会产生1 个亿的数据,显然基于传统MySQL数据库已经无法支撑满足以上需求