MySQL与PostgreSQL对比

MySQL PostgreSQL
数据类型支持 支持JSON,但不如PostgreSQL 支持更多的数据类型,如数组、hstore、JSON、JSONB、范围类型等
扩展性 有一些扩展性,但不如PostgreSQL 支持自定义数据类型、函数、操作符,具有强大的扩展性
SQL兼容性 遵循SQL标准,但有一些自定义扩展 更接近ANSI SQL标准,支持窗口函数、公共表表达式等
性能优化 对简单查询进行了优化,特别是读密集型摸作 有一个复杂的查询优化器,对于复杂查询很有优势
外部连接 有限的外部连接支持 支持外部表、外部连接,可以与其他数据周或数据源进行连接
程序语言支持 主要支持SQL和JavaScript,通过MySQL Shell支持Python 支持多补存储过程语言,如PL/pgSQL、PL/TCl、PL/Python等
地理信息系统 有空间扩展,但不如PostGIS强大 通过PostGIS扩展提供强大的GIS支持
复制和分区 支持基于二进制日志的复制,也支持表分区 支持逻辑复制、表分区、双向复制等
学习曲线 由于其广没的使用和丰富的社区资源,相对容易上手 对于初学者可能稍微陡峭一些,特别是在高级特性和优化方面
市场份额 在Web应用领域有很大的市场份频,被广泛采用 在企业级应用和特定领域(如GIS)中堂欢迎,但在小型Web应用中的市场份额较小
管理工具 有丰宫的管理工具,如MySQL Workbench,以及大量的第三方工具 尽等有--些第三方工具,但可能不如MySOL丰富
维护团队 MySQL的背后是一个成熟的商业公司,使得MySQL的开发过程更为慎重 PostgreSQL的背后是一个庞大的志愿开发组,PostgreSQL的反应更为迅速
MVCC MySQL采用了一种基于"回滚段"的方法来保存元组的历史版本(前像),如果事务更新了一条元组,它可以"原地"更新这条元组(新元组的 Size 需要小于等于旧元组的 Size),历史元组会以 Undo 日志记录的形式保存到回滚段中,这样就实现了元组的原地更新(Inplace Update)。当有并发事务需要访问历史元组时,可以从回滚段中"回滚"出这条元组,如果事务异常终止,则可以利用 Undo 日志将数据恢复。当所有可能访问历史元组的事务全部结束后,Undo 日志中的历史元组就可以被清理。由于 Undo 日志被集中存储到某一个回滚段,所以清理也较为便捷。 PostgreSQL 将历史元组和最新元组都保存在 Heap 表中,这种方式的好处是无须做回滚操作,如果一个写事务异常终止,则其他事务将无法读到这条元组。此方法虽然可以避免事务回滚带来的消耗,但仍被广为诟病。假设一个事务不停地更新数据,那么一条元组就会产生大量的历史版本。其他事务在访问时需要查看这些元组是否满足可见性要求,这会增加读操作的时延,降低数据扫描的效率。为了防止数据膨胀,PostgreSQL 数据库采用 Vacuum 机制清理表中的无效元组。如果使用 Vacuum FULL 命令,则还会负责对所有的元组进行搬迁,避免清理页面的过程中产生大量的"空洞"。
进程模型 多线程优点:▶︎ 资源效率:线程共享相同的内存空间,这通常导致更低的内存使用和更快的上下文切换。▶︎ 高并发性:多线程模型通常能够更好地处理高并发情况,尤其是在多核 CPU 上。▶︎ 线程间通信:线程间通信通常比进程间通信更简单和更快。适合短暂任务:对于短暂的、需要快速响应的任务,多线程模型可能更为合适。缺点:▶︎ 稳定性问题:一个线程的问题可能会影响到同一进程中的其他线程。例如,一个线程导致的内存泄可能会影响整个进程。▶︎ 复杂的同步:在多线程环境中,数据同步和锁定可能会变得更加复杂。全局变量和静态变量:由于线程共享内存,全局变量和静态变量的使用可能会导致问题。 PostgreSQL 采用多进程优点:▶︎ 稳定性:由于每个连接都有自己的进程,一个进程崩溃不太可能影响其他进程。这为系统提供了额外的稳定性。▶︎ 内存隔离:每个进程都有自己的内存空间,这可以减少内存泄漏或其他问题对整个系统的影响。▶︎ 开发简单性:多进程模型在某些情况下可能更容易开发和维护。缺点:▶︎ 资源开销:进程通常比线程需要更多的资源。每个进程都有自己的内存空间,这可能导致更的内存使用。▶︎ 上下文切换:进程之间的上下文切换可能比线程之间的上下文切换更加昂贵。▶︎ 进程间通信:进程间通信(IPC)可能比线程间通信更复杂和开销更大。
数据结构 索引组织表:数据直接存储在主键索引的叶子节点中,这意味着表数据按主键的顺序存储。由于数据与主键索引紧密结合,所以通常可以更快地访问基于主键的查询。优点:▶︎ 查询性能:由于数据是按键值排序的,范围查询和某些类型的查找可以更快。▶︎ 空间效率:通常使用较少的磁盘空间,因为它们减少了数据的冗余和碎片。▶︎ 数据完整性:由于数据是按键值存储的,这可以确保数据的完整性和一致性。 堆表:数据存储在一个称为"堆"的无序结构中。索引存储指向堆中行的指针(CTID),而不是实际的行数据。优点:▶︎ 简单性:堆表是最基本的表结构,不需要特定的排序或组织。▶︎ 快速插入:数据可以迅速地添加到表的末尾,不需要重新排序或调整数据。▶︎ 灵活性:可以轻松地添加或删除索引,而不影响表的基本结构。缺点:▶︎ 查询速度:由于数据没有特定的组织方式,查询可能需要全表扫描,尤其是在没有索引的情况下。▶︎ 空间使用:可能会有更多的碎片,因为删除的行可能不会立即被回收,需要额外的操作如表重组来回收空间。
开源协议 MySQL 采用 GPLv2 是一个"传染性"的开源许可证,这意味着任何基于 GPLv2 许可的代码进行修改或扩展,并且要分发的派生作品,也必须在 GPLv2 下发布。这确保了软件的自由性,但也可能限制了与非 GPL 软件的集成。 PostgreSQL License 是一个宽松的开源许可证,类似于 MIT 许可证。它允许用户自由使用、修改和分发,无需公开源代码。它也不强制任何特定的版权声明,这使得它与许多其他开源和专有许可证兼容。
相关推荐
shelby_loo3 小时前
通过 Docker 部署 MySQL 服务器
服务器·mysql·docker
ImomoTo3 小时前
HarmonyOS学习(十三)——数据管理(二) 关系型数据库
数据库·学习·harmonyos·arkts·鸿蒙
机器视觉知识推荐、就业指导5 小时前
Qt/C++事件过滤器与控件响应重写的使用、场景的不同
开发语言·数据库·c++·qt
jnrjian5 小时前
export rman 备份会占用buff/cache 导致内存压力
数据库·oracle
isNotNullX6 小时前
一文解读OLAP的工具和应用软件
大数据·数据库·etl
小诸葛的博客8 小时前
pg入门1——使用容器启动一个pg
数据库
sleP4o8 小时前
Python操作MySQL
开发语言·python·mysql
大熊程序猿9 小时前
python 读取excel数据存储到mysql
数据库·python·mysql
落落落sss9 小时前
sharding-jdbc分库分表
android·java·开发语言·数据库·servlet·oracle