数据库：市场中都有哪些数据库 / 优缺点使用情况

本文将从底层原理、市场格局、国产信创、选型决策四个维度，通过多张核心对比表格，构建完整的数据库认知体系。

📊 表1：数据库核心技术特性深度对比（基于CAP定理）

这张表揭示了数据库设计的底层逻辑：CAP定理（一致性Consistency、可用性Availability、分区容错性Partition tolerance，三者不可兼得）。

数据库类型	CAP权衡	数据模型	扩展性	一致性模型	典型应用场景
关系型 (RDBMS)	CP (强一致性)	二维表 (Rows & Columns)	垂直扩展为主 (Scale-up)	强一致性 (ACID)	金融交易、ERP、核心订单系统
键值 (Key-Value)	AP (高可用)	Key -> Value	水平扩展 (Scale-out)	最终一致性	缓存、会话管理、配置中心
文档 (Document)	AP (高可用)	JSON/BSON	水平扩展 (Scale-out)	最终一致性/因果一致性	内容管理、电商商品目录、日志
列式 (Columnar)	CP/AP (视产品而定)	列族	水平扩展 (Scale-out)	强一致性 (写) / 最终一致性 (读)	大数据分析、BI报表、日志存储
图 (Graph)	CP (强一致性)	节点、边、属性	水平扩展 (Scale-out)	强一致性 (ACID)	社交网络、反欺诈、知识图谱
NewSQL	CP (强一致性)	关系表 (分布式)	水平扩展 (Scale-out)	强一致性 (ACID)	分布式金融核心、高并发电商

🌏 表2：全球与国产数据库"信创"势力全景图

这张表侧重于市场地位、技术路线和国产化替代的现实格局。

阵营	代表产品	核心技术路线	优势	劣势/挑战	市场地位
国际巨头	Oracle	集中式 RDBMS	性能极致、生态极其完善、工具链成熟	价格昂贵、封闭、去O难度大	金融/电信核心系统霸主，正在被替代
国际开源	MySQL	集中式 RDBMS	生态之王、免费、社区活跃	超大数据量下分库分表困难	互联网应用事实标准
国际开源	PostgreSQL	对象-关系型	功能最强、支持JSON/GIS、无限制	学习曲线稍陡	开发者中最受欢迎，增长最快
国产-分布式	OceanBase	原生分布式 (Paxos)	金融级高可用、强一致、抗住双11	架构重、运维复杂	蚂蚁金服出身，金融信创首选
国产-分布式	TiDB	NewSQL (Raft)	兼容MySQL、水平扩展、云原生	资源消耗较大	开源生态之王，海外影响力最大
国产-云原生	PolarDB	云原生数据库	与阿里云深度绑定、高性能、弹性	深度绑定云厂商	阿里云生态领跑者
国产-集中式	达梦 (DM8)	集中式 RDBMS	高度兼容Oracle、安全等级高	生态相对封闭	党政军市场根基深厚
国产-集中式	人大金仓	集中式/多模	迁移成本低、100%自研内核	高端功能较Oracle少	电子政务市占率高，信创集成领头羊
其他国产	GaussDB (华为)	分布式/集中式	软硬件协同优化、AI能力强	生态主要在华为体系	华为政企业务核心

💡 国产数据库选型提示：

替换Oracle ：优先考虑达梦、金仓（语法最兼容，迁移成本低）。

海量数据/高并发 ：优先考虑 OceanBase 、TiDB（架构更先进，弹性好）。

云上项目 ：优先考虑 PolarDB 、GaussDB（云原生集成度高）。

⚙️ 表3：NoSQL细分领域"特种兵"详细参数表

NoSQL不是一种数据库，而是一类数据库的总称。选对细分类型至关重要。

类型	代表产品	存储引擎	读写性能	查询能力	典型缺点
Redis	内存哈希表	内存	极高 (10w+ QPS)	简单的Key查询、List/Set操作	数据易丢失(需持久化)、内存昂贵
MongoDB	WiredTiger	磁盘+内存	高	丰富的索引、聚合管道	占用空间大、多表事务支持较弱
HBase	LSM-Tree	磁盘 (HDFS)	中 (写高、读中)	单行查询快、多表关联难 (需Phoenix)	运维极复杂、不适合实时分析
ClickHouse	MergeTree	磁盘	极高 (分析场景)	聚合查询极快、不适合点查/删除	不适合事务、Join能力弱
Neo4j	原生图存储	磁盘+内存	中	图遍历、最短路径	数据量极大时性能下降
Elasticsearch	倒排索引	磁盘	高 (搜索场景)	全文检索、模糊查询	不是数据库，不支持ACID事务

🚀 表4：数据库选型决策矩阵（一张表帮你做决定）

这是最实操的部分，根据业务场景直接对号入座。

你的业务场景	数据量级	一致性要求	并发要求	推荐选型	理由
传统企业ERP/财务/核心交易	中 (<1TB)	极高 (不能错一分钱)	中高	Oracle / PostgreSQL	ACID事务是底线，复杂查询能力强
互联网SaaS/电商/CMS	大 (>1TB)	高	极高	MySQL / TiDB	生态成熟，TiDB解决分库分表痛点
物联网/监控/日志分析	海量 (>10TB)	低 (可容忍延迟)	高写入	ClickHouse / HBase	列式存储，写入和聚合分析速度极快
社交/推荐/知识图谱	中	中	高	Neo4j	关系遍历是核心，SQL难以实现
缓存/会话/排行榜	小 (<100GB)	低 (可丢失)	极高	Redis	内存操作，微秒级响应
内容管理/灵活配置	中	中	中	MongoDB	Schema-free，无需迁移表结构
党政军/国企信创项目	视情况	极高	中高	达梦 / 金仓 / OceanBase	政策合规，安全可控，去IOE
实时搜索/日志检索	大	低	高	Elasticsearch	倒排索引技术，搜索体验最好

🧠 表5：数据库技术演进趋势表

了解未来方向，避免技术栈过时。

趋势方向	核心概念	代表技术/产品	解决的痛点
云原生 (Cloud Native)	Serverless、存算分离	AWS Aurora, Snowflake, PolarDB	弹性伸缩、按量付费、免运维
HTAP (混合事务/分析)	一套系统搞定交易+分析	TiDB, OceanBase, Oracle HeatWave	避免ETL延迟，实时决策
AI融合 (AI4DB)	AI自动调优、索引推荐	Oracle Autonomous, Microsoft Azure SQL	DBA人力成本高、性能调优难
多模数据库	一种DB支持多种模型	PostgreSQL (JSON/GIS), ArangoDB	减少技术栈复杂度，统一接口
向量数据库	存储Embedding，支持AI检索	Pinecone, Milvus, pgvector	支撑大模型(LLM)的长记忆和RAG应用

💎 终极建议：架构师的数据库心法

默认选择 ：如果不确定，PostgreSQL 是功能最全、最不容易后悔的选择；MySQL 是招人最容易、生态最丰富的选择。

不要银弹：不要试图用一种数据库解决所有问题。现代企业架构通常是"混合持久化"（Polyglot Persistence）：

MySQL/PG 存核心业务数据。

Redis 做缓存和热点加速。

MongoDB 存日志、配置等非结构化数据。

ClickHouse/ES 专门做分析和搜索。

TiDB/OB 应对海量数据和高并发挑战。

信创策略：在国企/政府项目中，"兼容"比"先进"更重要。优先选择高度兼容Oracle语法的国产库（如达梦、金仓），能节省80%的迁移成本。

关注向量DB：如果你的业务涉及AI、大模型、语义搜索，向量数据库（Vector DB）正在成为新的基础设施标配，PostgreSQL通过pgvector插件已能很好支持。

数据库：市场中都有哪些数据库 / 优缺点 使用情况