技术栈
Spark_Spark高阶特性
高达一号
2023-11-29 8:17
wscg
filter导致断链
Codegen
向量化
simdjson
Orc
Parquet 支持批量读取
spark本身对parquet支持比较好,因为parquet
大数据
分布式
spark
上一篇:
如何基于gensim和Sklearn实现文本矢量化
下一篇:
Spring Boot | 集成Drools规则引擎、动态执行规则
相关推荐
QCC产品中心
4 小时前
MiniMax Agent 接入实测:企业查询、股权穿透与 UBO 识别(附 Prompt 模板)
大数据
·
mcp
·
金融/非金融
SelectDB
21 小时前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据
·
数据库
·
python
ApacheSeaTunnel
1 天前
当多表数据涌入,Apache SeaTunnel 如何巧妙化解主键冲突?
大数据
·
开源
·
数据集成
·
seatunnel
·
技术分享
·
数据同步
大大大大晴天
4 天前
Hudi Metadata Table 与 Hive Sync (HMS)怎么选?
大数据
手可摘星辰777
4 天前
一次线上FlinkCDC异常排查复盘
大数据
·
flink
大大大大晴天
4 天前
Hudi技术内幕:Metadata Table原理与实践
大数据
大大大大晴天
5 天前
Hudi技术内幕:深入解析Index索引机制
大数据
阿里云大数据AI技术
5 天前
Flink Forward Asia 2026 深圳启幕:Agentic Streaming for AI,开启实时智能新范式
大数据
·
flink
SelectDB
6 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据
·
数据库
·
aigc
大大大大晴天
9 天前
Hudi技术内幕:RecordPayload到RecordMerger
大数据
热门推荐
01
2026 年 AI 编程工具终极横评:Cursor vs Claude Code vs Copilot vs Windsurf
02
2026年6月AI大模型全景报告:GPT-5.6、Claude Opus 4.8、Gemini 3.5,中美AI三足鼎立谁主沉浮?
03
2026年6月AI行业全景:从百模大战到Agent元年,这30天发生了什么?
04
GitHub 镜像站点
05
【AI】2026 年具身智能模型和世界模型总结
06
Trae国际版与国内版深度测评:AI原生IDE的双生花
07
Claude Code、Codex、Cursor三分天下:2026年AI编程Agent生态全景剖析
08
2026 AI 编程工具终极实战指南:Cursor vs Claude Code vs Copilot,开发者该怎么选?
09
飞书长连接_事件订阅(接收消息,审批任务状态变更)
10
2026 年 AI 大模型 & AI 编程工具实战全总结