【YashanDB知识库】yashandb执行包含带oracle dblink表的sql时性能差

本文内容来自YashanDB官网,具体内容请见https://www.yashandb.com/newsinfo/7396959.html?templateId=1718516

问题现象

yashandb执行带oracle dblink表的sql性能差:


同样的语句,同样的数据,oracle通过dblink访问远端oracle执行,耗时不到1秒钟:

问题的风险及影响

yashandb通过dblink访问oracle性能不佳,影响业务运行效率及客户体验

问题影响的版本

截止目前所有的yashandb版本

问题发生原因

yashandb在访问远端oracle的数据时,拉取了表的所有列。并且每批次只拉取16条数据,在网络有时延时(现场网络时延0.4ms),会有额外的网络传输耗时。

解决方法及规避方式

内核修改代码优化。规避方式为在远端oracle侧创建视图,只查询需要的列。

问题分析和处理过程

使用 sudo tc qdisc add dev bond1 root netem delay 0.45ms 命令模拟网络时延

并将客户的数据导回来,在测试环境模拟重现,yashandb的耗时:

oracle的耗时:

细观察oracle的执行计划,我们可以发现,其访问远端表并不是将所有列的数据拉回来了,而只是拉回来了select查询语句中需要的列:

使用OCI驱动编程使用示例 中提供的例子可以分析oci的耗时。

fetch size如果为2000,只从CUX.CUX_PM_PG_SUB_PROJECTS表中查询"SUB_PROJECT_ID","PROJECT_NAME"两列,耗时100ms左右,注意此时的网络时延仍然为0.45ms:

结合以上分析,yashan需要优化的方向为:

1、只从dblink拉取查询需要的列数据

2、设置合理的fetch size,不能太小

经验总结

使用oci编程可以验证yashandb访问oracle dblink远端表在不同情况下的性能表现

相关推荐
网络工程小王22 分钟前
【Python数据分析基础】
大数据·数据库·人工智能·学习
Fortune791 小时前
用Pandas处理时间序列数据(Time Series)
jvm·数据库·python
2401_878530211 小时前
高级爬虫技巧:处理JavaScript渲染(Selenium)
jvm·数据库·python
2401_873544921 小时前
使用Black自动格式化你的Python代码
jvm·数据库·python
艾莉丝努力练剑1 小时前
【MYSQL】MYSQL学习的一大重点:表的约束
linux·运维·服务器·开发语言·数据库·学习·mysql
Fortune791 小时前
用Python破解简单的替换密码
jvm·数据库·python
2401_873544921 小时前
Python深度学习入门:TensorFlow 2.0/Keras实战
jvm·数据库·python
会编程的土豆1 小时前
全面解析数据库锁机制:从行锁到死锁的深度剖析
数据库
tongxh4231 小时前
5、使用 pgAdmin4 图形化创建和管理 PostgreSQL 数据库
数据库·postgresql
qq_148115371 小时前
将Python Web应用部署到服务器(Docker + Nginx)
jvm·数据库·python