技术栈

Spark_Spark高阶特性

高达一号2023-11-29 8:17

wscg

filter导致断链

Codegen

向量化

simdjson

Orc

Parquet 支持批量读取

spark本身对parquet支持比较好,因为parquet

上一篇:如何基于gensim和Sklearn实现文本矢量化
下一篇:Spring Boot | 集成Drools规则引擎、动态执行规则
相关推荐
QCC产品中心
4 小时前
MiniMax Agent 接入实测:企业查询、股权穿透与 UBO 识别(附 Prompt 模板)
大数据·mcp·金融/非金融
SelectDB
21 小时前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
ApacheSeaTunnel
1 天前
当多表数据涌入,Apache SeaTunnel 如何巧妙化解主键冲突?
大数据·开源·数据集成·seatunnel·技术分享·数据同步
大大大大晴天
4 天前
Hudi Metadata Table 与 Hive Sync (HMS)怎么选?
大数据
手可摘星辰777
4 天前
一次线上FlinkCDC异常排查复盘
大数据·flink
大大大大晴天
4 天前
Hudi技术内幕:Metadata Table原理与实践
大数据
大大大大晴天
5 天前
Hudi技术内幕:深入解析Index索引机制
大数据
阿里云大数据AI技术
5 天前
Flink Forward Asia 2026 深圳启幕:Agentic Streaming for AI,开启实时智能新范式
大数据·flink
SelectDB
6 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
大大大大晴天
9 天前
Hudi技术内幕:RecordPayload到RecordMerger
大数据
热门推荐
012026 年 AI 编程工具终极横评:Cursor vs Claude Code vs Copilot vs Windsurf022026年6月AI大模型全景报告:GPT-5.6、Claude Opus 4.8、Gemini 3.5,中美AI三足鼎立谁主沉浮?032026年6月AI行业全景:从百模大战到Agent元年,这30天发生了什么?04GitHub 镜像站点05【AI】2026 年具身智能模型和世界模型总结06Trae国际版与国内版深度测评:AI原生IDE的双生花07Claude Code、Codex、Cursor三分天下:2026年AI编程Agent生态全景剖析082026 AI 编程工具终极实战指南:Cursor vs Claude Code vs Copilot,开发者该怎么选?09飞书长连接_事件订阅(接收消息,审批任务状态变更)102026 年 AI 大模型 & AI 编程工具实战全总结