news 2026/5/10 20:48:44

数据、数据库分类

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
数据、数据库分类

1、概述

  • 数据库主要分为关系型数据库(如MySQL、Oracle)和非关系型数据库(NoSQL,如MongoDB、Redis),其中NoSQL又包括键值存储、文档数据库、列存储、图数据库等类型。
  • 数据则分为结构化数据(如表格数据)、半结构化数据(如JSON、XML)和非结构化数据(如文本、图像、视频)。

2、数据库的主要类型

数据库的分类维度较多,主流是按数据模型划分,不同类型的数据库针对不同的数据存储和访问场景设计,核心类型如下:

关系型数据库(RDBMS)

  • 核心特点:基于关系模型(二维表结构),数据以行(记录)和列(字段)的形式存储,遵循 ACID(原子性、一致性、隔离性、持久性)原则,支持 SQL(结构化查询语言),强调数据的一致性和完整性。
  • 典型产品:MySQL、Oracle、PostgreSQL、SQL Server。
  • 适用场景:需要事务支持、数据强一致性、结构化查询的场景。

非关系型数据库(NoSQL)

这类数据库不依赖传统的关系模型,为应对大规模、高并发、非结构化 / 半结构化数据场景而生,主要分为以下子类:

子类核心特点典型产品核心场景
键值型数据库以 “键 - 值” 对存储数据,查询速度极快Redis、Memcached缓存、会话存储、计数器、实时推荐
文档型数据库存储半结构化的文档(如 JSON/BSON 格式),支持嵌套结构MongoDB、CouchDB内容管理系统、电商商品数据、用户画像
列族型数据库按列存储数据,适合批量列查询,扩展性强HBase、Cassandra大数据分析、日志存储、时序数据
图形数据库以节点和边存储数据,专注处理实体间的关系Neo4j、ArangoDB社交网络关系、知识图谱、路径规划

新型数据库

  • 时序数据库:专为时间戳关联的数据设计,支持高吞吐写入和按时间范围的快速查询,典型产品:InfluxDB、TimescaleDB,适用于物联网传感器数据、监控指标、金融交易流水。
  • 向量数据库:存储和检索向量数据(如 AI 模型生成的嵌入向量),支持相似度计算,典型产品:Milvus、Pinecone,适用于图像 / 文本检索、推荐系统、大模型知识库。

3、数据的主要类型

数据结构和业务属性划分,数据可分为以下几类,与数据库类型的匹配是选型的核心逻辑。

结构化数据

  • 定义:数据格式固定、有明确的结构,可直接映射为二维表的行和列。
  • 示例:用户 ID、订单编号、商品价格、出生日期、性别。
  • 适合的数据库关系型数据库(如 MySQL、Oracle)。
  • 匹配逻辑:结构化数据的强规范性与关系型数据库的表结构、约束(主键、外键、唯一性约束)高度契合,SQL 查询能高效完成多表关联、聚合分析。

半结构化数据

  • 定义:数据有一定结构,但结构不固定或可扩展,支持嵌套和灵活字段。
  • 示例:JSON 格式的用户信息(含基础字段 + 可选的扩展字段)、XML 文档、日志数据。
  • 适合的数据库文档型数据库(如 MongoDB)、部分支持灵活 Schema 的关系型数据库(如 PostgreSQL 的 JSONB 类型)。
  • 匹配逻辑:文档型数据库无需预先定义表结构,可直接存储嵌套的半结构化数据,支持按文档内字段查询,比关系型数据库更灵活。

非结构化数据

  • 定义:无固定格式,无法直接用二维表表示的数据。
  • 示例:图片、音频、视频、PDF 文档、纯文本日志、自然语言文本。
  • 适合的数据库
    • 直接存储:对象存储(如阿里云 OSS、AWS S3)+ 元数据存储(关系型 / 文档型数据库);
    • 检索分析:若需提取特征或检索,可结合向量数据库(如 Milvus,将非结构化数据转为向量后存储)。
  • 匹配逻辑:非结构化数据体积大、结构无规律,传统数据库难以高效存储和检索,对象存储负责低成本海量存储,元数据 / 向量数据库负责管理检索维度。

时序数据

  • 定义:与时间强关联、按时间顺序产生的连续数据,具有高写入、高查询频率的特点。
  • 示例:服务器 CPU 使用率、物联网设备的温度读数、股票价格波动、用户行为日志。
  • 适合的数据库时序数据库(如 InfluxDB、TimescaleDB)、列族型数据库(如 HBase)。
  • 匹配逻辑:时序数据库针对时间维度做了特殊优化,支持按时间范围的快速聚合查询,比关系型数据库的写入和查询效率高 10 倍以上。

关系型数据

  • 定义:核心价值在于实体之间的关联关系,而非单个实体的数据本身。
  • 示例:社交网络中用户的关注关系、知识图谱中 “疾病 - 症状 - 药物” 的关联、地图中的 “地点 - 路线 - 交通方式” 关系。
  • 适合的数据库图形数据库(如 Neo4j)。
  • 匹配逻辑:关系型数据库查询多实体关联时需多次多表 Join,效率极低;图形数据库以节点和边直接存储关系,查询 “用户的好友的好友” 这类多层关系时,速度远超传统数据库。

4、数据类型与数据库类型的匹配总结表

数据类型推荐数据库类型典型应用场景
结构化数据关系型数据库(MySQL/Oracle)电商订单系统、银行交易系统、ERP 系统
半结构化数据文档型数据库(MongoDB)内容管理系统、用户画像、配置数据
非结构化数据对象存储 + 元数据 / 向量数据库图片 / 视频存储、文档检索、大模型知识库
时序数据时序数据库(InfluxDB)监控系统、物联网数据、金融流水
关系型数据图形数据库(Neo4j)社交网络、知识图谱、路径规划
高频读写的小数据键值型数据库(Redis)缓存、计数器、会话存储

参考文档:

https://xixingzhe.blog.csdn.net/article/details/149279707?spm=1011.2415.3001.5331

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 1:32:30

温州医科大学本科生一年内发表近50篇sci论文?

源自风暴统计网:一键统计分析与绘图的网站这几天,温州医科大学本科生洪某一年内发近50篇SCI的帖子登上热议。刚看到这个消息时,可能很多人第一反应是这怎么可能!同名同姓?不会又是哪个“学二代”吧?但这事儿…

作者头像 李华
网站建设 2026/5/9 1:50:06

开源TTS新突破:EmotiVoice实现高表现力语音生成

开源TTS新突破:EmotiVoice实现高表现力语音生成 在智能语音助手越来越“懂事”的今天,我们是否还满足于它们冷静、平稳但毫无波澜的语调?当游戏角色说出“我恨你”时语气却像在念购物清单,当有声书旁白讲述悲剧时依然面无表情——…

作者头像 李华
网站建设 2026/5/9 2:31:02

零基础部署LobeChat镜像,轻松实现大模型私有化接入

零基础部署LobeChat镜像,轻松实现大模型私有化接入 在企业对数据隐私要求日益严苛的今天,越来越多团队开始将目光从公有云AI服务转向本地部署方案。你是否也遇到过这样的困境:好不容易跑通了一个开源大模型,却只能通过命令行交互&…

作者头像 李华
网站建设 2026/5/9 1:01:56

17、Go语言中的数据编码与解码:CSV、JSON和XML

Go语言中的数据编码与解码:CSV、JSON和XML 在Go语言开发中,数据的编码与解码是常见的操作,尤其是在处理CSV、JSON和XML等数据格式时。本文将详细介绍这些数据格式在Go语言中的使用方法,包括解码、编码、自定义选项以及相关的技术细节。 1. CSV数据处理 在Go语言里,能够…

作者头像 李华
网站建设 2026/5/10 13:18:24

4.1.17.6.锁

1.锁的分类 1.1.按锁粒度划分 表锁:开销小,加锁快;锁定力度大,发生锁冲突概率高,并发度最低;不会出现死锁。 行锁:开销大,加锁慢;会出现死锁;锁定粒度小,发生…

作者头像 李华