Flink 写入 Doris 常见报错和问题

字段数量、格式问题

task 一启动就会有明确的报错,直接调整即可

运行一会报错,报错中有个 doris 链接

可以通过链接访问拿到报错日志,里面有错误信息

长度之类的问题,自己调整字段长度,或者过滤

一些特殊字符,可能也会报字段数量长度不对之类的,但其实如果不对早就报了,大概率是默认 csv 导入,特殊字符导致的问题

可以调整一下写入方式,改为json,sink---doris 加个参数

'sink.properties.format' = 'json',
'sink.properties.read_json_by_line' = 'true'

INTERNAL_ERROR Cancelled END_OF_FILE Encountered unqualified data, stop processing, see more in null

这种也是运行一会报错,报错中没有链接,光说 see more in null 的

一般都是主键、分区键有问题

  • 主键字段中存在 null 值
  • 分区字段超过分区键的范围,比如分区从 2024 年开始,但数据中有 2020 年的数据
相关推荐
fajianchen5 分钟前
当Elasticsearch索引数据量过多时,可以采取以下措施进行优化和部署
大数据·elasticsearch·搜索引擎
viperrrrrrrrrr71 小时前
大数据学习(32)-spark基础总结
大数据·学习·spark
Elastic 中国社区官方博客2 小时前
Elasticsearch:优化的标量量化 - 更好的二进制量化
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·lucene
shen121383 小时前
【Elasticsearch】配置分片分配到指定节点
大数据·elasticsearch·jenkins
数信云 DCloud3 小时前
通付盾荣获“2024北京软件核心竞争力企业(技术研发型)”称号
大数据·人工智能·区块链
沐霜枫叶5 小时前
Flink三种集群部署模型
大数据·flink
leo_hush5 小时前
【Flink】flink或java异常日志输出不完整问题解决
java·大数据·flink
Aloudata6 小时前
NoETL 自动化指标平台如何帮助企业实现战略目标与执行目标对齐?
大数据·数据挖掘·数据分析·自动化·指标平台
兔子宇航员03019 小时前
数据开发八股文整理- Hadoop
大数据·hadoop·分布式