技术栈
大数据处理
青云交
1 个月前
数据库
·
内存管理
·
apache hive
·
数据集成
·
大数据处理
·
datafusion
·
查询处理
·
powercenter
大数据新视界 --大数据大厂之 DataFusion:超越传统的大数据集成与处理创新工具
💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。💖💖💖
青云交
2 个月前
数据库
·
kubernetes
·
容器编排
·
资源管理
·
大数据处理
·
扩展性、故障恢复
·
存储持久化
·
监控、日志管理、性能提升
大数据新视界 --大数据大厂之Kubernetes与大数据:容器化部署的最佳实践
💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。💖💖💖
Trouvaille ~
2 个月前
python
·
机器学习
·
数学建模
·
数据分析
·
numpy
·
科学计算
·
大数据处理
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧
NumPy,即Numerical Python,是Python中最为常用的科学计算库之一。它提供了强大的多维数组对象ndarray,并支持大量的数学函数和操作。与Python内置的列表相比,NumPy数组的计算速度更快,占用内存更少,非常适合处理大量的数据。
贪钱算法还我头发
7 个月前
python
·
pandas
·
pyspark
·
大数据处理
【小贪】大数据处理:Pyspark, Pandas对比及常用语法
近期致力于总结科研或者工作中用到的主要技术栈,从技术原理到常用语法,这次查缺补漏当作我的小百科。主要技术包括:
架构成长指南
8 个月前
datax
·
数据同步
·
数据库中间件
·
大数据处理
什么是数据同步利器DataX,如何使用?
转载至我的博客 https://www.infrastack.cn ,公众号:架构成长指南今天给大家分享一个阿里开源的数据同步工具DataX,在Github拥有14.8k的star,非常受欢迎,官网地址:https://github.com/alibaba/DataX
架构成长指南
9 个月前
doris
·
实时数仓
·
分库分表
·
大数据处理
基于Doris构建亿级数据实时数据分析系统
转载至我的博客 https://www.infrastack.cn ,公众号:架构成长指南随着公司业务快速发展,对业务数据进行增长分析的需求越来越迫切,与此同时我们的业务数据量也在快速激增、每天的数据新增量大概在30w 左右,一年就会产生1 个亿的数据,显然基于传统MySQL数据库已经无法支撑满足以上需求