技术栈
数据处理
杰瑞不懂代码
10 天前
python
·
excel
·
pandas
·
办公自动化
·
数据处理
使用pandas操作EXCEL表格入门教程
为什么要学习pandas?我们之前其实已经接触了xlwings,它的强项是控制 Excel。比如打开文件、读写单元格、设置字体颜色、操作图表。它不擅长计算,但是如果用 xlwings 逐行遍历 10 万行数据做加法,速度会比蜗牛还慢,同样如果用VBA处理,庞大的数据处理需求,就有点难为二位了
科研面壁者
11 天前
3d
·
可视化
·
origin
·
数据处理
·
科研绘图
Origin科研绘图——3D 百分比堆积墙型图
更多免费教程和软件 :👆关注我👆 每天学点习吧!3D 百分比堆积墙型图(3D Percent Stacked Area/Wall Chart)是一种在三维效果下展示的堆积面积图。
ha_lydms
15 天前
java
·
大数据
·
python
·
spark
·
数据处理
·
maxcompute
·
spark 函数
5、Spark函数_s/t
schema_of_avro(jsonFormatSchema, options) - Returns schema in the DDL format of the avro schema in JSON string format.
isNotNullX
15 天前
数据库
·
数据资产管理
·
数据处理
·
企业数字化
数据处理的流程是什么?如何进行数据预处理?
目录第一部分:把数据处理看成一条有顺序的“流水线”第二部分:数据预处理:我们在处理哪些具体问题?第一个典型问题:数据不完整——有缺失、有空值
ha_lydms
17 天前
大数据
·
分布式
·
spark
·
函数
·
数据处理
·
dataworks
·
maxcompute
3、Spark 函数_d/e/f/j/h/i/j/k/l
date(expr) - Casts the value expr to the target data type date.
ha_lydms
17 天前
大数据
·
数据库
·
python
·
sql
·
spark
·
数据处理
·
dataworks
4、Spark 函数_m/n/o/p/q/r
make_date(year, month, day) - Create date from year, month and day fields. If the configuration spark.sql.ansi.enabled is false, the function returns NULL on invalid inputs. Otherwise, it will throw an error instead.
ha_lydms
17 天前
java
·
大数据
·
python
·
spark
·
数据处理
·
dataworks
·
spark 函数
6、Spark 函数_u/v/w/x/y/z
ucase(str) - Returns str with all characters changed to uppercase.
娃乐呵
21 天前
语言模型
·
大模型
·
excel
·
数据处理
免费的大批量Excel文档大模型处理数据工具
我们提出了一种可以利用大模型批量对Excel条目做分类、汇总等操作的工具。工具地址:基于大模型批量分析Excel文件
康谋自动驾驶
22 天前
自动驾驶
·
数据处理
·
传感器
·
数据标注
·
数据闭环
·
端对端
aiData全自动化数据处理解决方案!
01 引言在汽车 AI 领域,无论是高级驾驶辅助系统(ADAS)还是自动驾驶技术的研发,都需要数据。因此高质量、精准且记录完备的数据,是神经网络训练、验证及仿真测试的核心支撑。
RestCloud
1 个月前
etl
·
数据处理
·
数据集成
·
etlcloud
·
数据同步
·
任务调度
·
异步数据处理
异步 vs 同步:ETL在任务调度中的架构选择
在数据集成与处理领域,任务调度是ETL流程稳定、高效运行的核心环节。面对不同的业务场景与时效要求,如何选择合适的调度方式,直接关系到数据作业的可靠性、资源的利用效率以及运维的复杂度。ETLCloud提供了灵活多样的流程任务调度模式,主要包括同步与异步两大架构方向,涵盖了从即时手动触发到复杂的自动化依赖调度等多种场景。本文将深入解析ETLCloud中几种关键的调度方式,帮助您理解其特点与适用场景,从而根据自身需求做出最适宜的架构选择。
科研面壁者
1 个月前
数据分析
·
回归
·
spss
·
数据处理
·
科研绘图
SPSS——非参数检验-“单样本K-S检验”
单样本K-S检验是以两位苏联数学家柯尔莫哥和斯米诺夫的名字命名的,是一种拟合优度检验,用于探索连续型随机变量的分布。
RestCloud
1 个月前
数据库
·
数据仓库
·
kafka
·
数据安全
·
etl
·
数据处理
·
数据集成
如何用ETL做实时风控?从交易日志到告警系统的实现
在当今快速发展的金融行业中,实时风控已成为保障业务安全、提高客户满意度的关键环节。传统的风控系统往往依赖于批量处理数据,难以及时发现和响应潜在的欺诈行为。而通过利用ETL技术,企业可以实现从交易日志到告警系统的实时数据处理,从而有效提升风控效率和准确性。本文将详细介绍如何利用ETL技术实现这一目标。
闲人编程
1 个月前
数据库
·
python
·
microsoft
·
数据处理
·
pydantic
·
codecapsule
Pydantic数据验证与序列化
『宝藏代码胶囊开张啦!』—— 我的 CodeCapsule 来咯!✨写代码不再头疼!我的新站点 CodeCapsule 主打一个 “白菜价”+“量身定制”!无论是卡脖子的毕设/课设/文献复现,需要灵光一现的算法改进,还是想给项目加个“外挂”,这里都有便宜又好用的代码方案等你发现!低成本,高适配,助你轻松通关!速来围观 👉 CodeCapsule官网
RestCloud
1 个月前
数据库
·
oracle
·
sqlserver
·
etl
·
cdc
·
数据处理
·
数据传输
SQL Server到Oracle:不同事务机制下的数据一致性挑战
在当今企业数据架构日益复杂的背景下,跨数据库平台的数据同步已成为许多组织的常态化需求。当数据需要从SQL Server迁移至Oracle时,我们不仅面临语法差异的挑战,更需深入理解两大数据库在事务处理机制上的本质区别。本文将深入探讨在异构数据库同步过程中,通过使用ETLCLoud的离线数据集成及实时数据集成功能,确保数据在跨平台传输时的一致性与完整性,为构建可靠的数据流通体系提供实践指导。
RestCloud
1 个月前
数据库
·
数据仓库
·
etl
·
数据处理
·
数据集成
·
数据传输
·
神州通用
神州通用数据库的 ETL 集成方案:兼容性与性能实战
在数字化时代,数据已经成为企业的重要资产,而神州通用数据库它以其卓越的兼容性和出色的性能,为企业数据管理提供了强大的支持。采用了先进的数据库内核技术和优化算法,能够高效处理大规模数据,支持高并发访问,满足企业级应用对性能的严格要求。它在事务处理、查询优化、数据存储等方面都进行了深度优化,确保在各种复杂场景下都能提供稳定、高效的性能表现。本文将详细阐述如何利用ETLCloud企业级数据集成平台,实现神州通用数据库数据同步到mysql数据库。
科研面壁者
1 个月前
3d
·
信息可视化
·
spss
·
数据处理
·
科研绘图
SPSS——绘制三维条形图(3D条形图)
更多免费教程:三维条形图也叫3D条形图。三维柱状图是一种利用三维坐标空间展示数据量级差异的统计图形。它以矩形立柱作为基本元素,通过在 X、Y、Z 三个方向同时编码信息,使数据的分布、对比和趋势更加直观。与传统二维柱状图相比,三维柱状图不仅能够呈现单一维度的数值变化,还能在一个图中表现多变量关系,例如不同类别在不同时间点或不同区域中的数值差异。
996终结者
1 个月前
matlab
·
数据处理
·
数据标准化
精通MATLAB中的数据标准化与归一化
在多元数据分析与机器学习的实践中,我们常常会遇到一个关键挑战:数据集中的不同特征往往具有各异的量纲和数值范围。例如,在一个包含年龄、年收入和信用评分的客户数据集中,年龄的范围可能是20-80,年收入可能是30,000-200,000,而信用评分可能是300-850。这种尺度上的巨大差异会严重影响许多机器学习算法的性能——基于距离计算的算法(如K近邻、聚类分析)会被数值范围大的特征所主导;基于梯度下降的优化算法(如神经网络、逻辑回归)则会因为参数空间的不均衡而收敛缓慢。
RestCloud
1 个月前
数据仓库
·
etl
·
cdc
·
数据处理
·
批处理
·
数据传输
·
数据同步
实时 vs 批处理:ETL在混合架构下的实践
在数字经济加速渗透的今天,数据已成为企业核心竞争力的关键载体。然而,企业在数据处理过程中始终面临着一个核心抉择:是选择实时 ETL满足即时决策需求,还是依赖批处理保障海量数据高效处理?两种模式看似对立,实则各有适配场景 —— 实时处理擅长低延迟响应,批处理则在高吞吐量、低成本运算中占据优势。如何打破模式壁垒,实现 “鱼与熊掌兼得” 的混合架构部署?下面将演示使用ETLCLoud的实时监听多表同步的案例。
zkl_zkl_
1 个月前
笔记
·
学习
·
数据处理
·
数据质量
·
空间数据
地理信息系统学习笔记——第六章 空间数据采集与处理
①野外数据采集:平板测量、全野外数字测图、GPS 空间定位测量。②地图数字化:扫描矢量化、手扶跟踪数字化。
科研面壁者
1 个月前
数据分析
·
origin
·
数据处理
·
科研绘图
Origin科研绘图——将“普通饼图”升级为“半环形饼图”
更多免费教程和软件分享:半环形饼图属于饼图的变体形式,主要用于展示数据的占比及分布情况,具有多项优势:能够直观呈现各部分占比;便于对比不同类别之间的差异;可突出显示重点数据;整体布局紧凑,空间利用率更高;同时也更适合展示较长的标签内容。