news 2026/5/15 12:27:27

hive数仓分层

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
hive数仓分层

目录

  • 1.hive数仓分层,一般分几个层级,每层的作用是什么
    • 1.1 常见分层及作用
      • (1)ODS 层(Operational Data Store,原始数据层)
      • (2)DWD 层(Data Warehouse Detail,明细数据层)
      • (3)DWS 层(Data Warehouse Summary,汇总数据层)
      • (4)ADS 层(Application Data Store,应用数据层)
      • (5)DIM 维度层和其他
    • 1.2 典型分层结构(示意图)
    • 1.3 总结表格

1.hive数仓分层,一般分几个层级,每层的作用是什么

Hive 数仓分层是构建数据仓库的经典方法论,其目的是规范数据流转过程,提升数据复用、易运维性和数据治理能力。通常,Hive 数仓分层主要分为 ODS(操作数据层)、DWD(明细数据层)、DWS(汇总数据层)、ADS(应用数据层),有的企业也会增加 DIM(维度层)、DML(中间层)、DMB(宽表层)等。下面详细说明:

1.1 常见分层及作用

(1)ODS 层(Operational Data Store,原始数据层)

  • 作用:存放从业务系统同步过来的原始数据,通常为业务表的全量或增量快照,最大化还原数据原貌。
  • 特点:与数据源表结构一致,未做复杂处理。
  • 数据来源:来自 OLTP 系统(如 MySQL、Oracle 等),一般通过定时同步(如 Sqoop、DataX)。
  • 用途:为后续数仓层清洗、加工提供数据保障。

(2)DWD 层(Data Warehouse Detail,明细数据层)

  • 作用:对 ODS 数据做清洗、解析、标准化,结构更规范、字段业务语义明确,且仍保留明细级别(不会丢失粒度)。
  • 特点:去重、格式统一、脏数据处理、字段口径规范化。
  • 数据来源:基于 ODS 层数据,经数据清洗加工得到。
  • 用途:作为数仓事实数据分析、统计的底层数据源。

(3)DWS 层(Data Warehouse Summary,汇总数据层)

  • 作用:基于 DWD 层,对明细数据进行多维度聚合、统计,形成中间宽表或多维分析表。
  • 特点:一般是按主题、业务过程、时间粒度做分组汇总(如日报、月报、周报)。
  • 数据来源:通常来源于 DWD 层。
  • 用途:数据服务于 OLAP 分析,支撑 BI、报表等多维分析,解决性能瓶颈。

(4)ADS 层(Application Data Store,应用数据层)

  • 作用:面向具体业务场景和应用需求,进一步加工生成最终报表、指标、接口、标签等。
  • 特点:粒度更粗、结构更简单,直接为业务方或应用系统服务。
  • 数据来源:通常基于 DWS 层,有时也引用维度表、事实宽表。
  • 用途:支撑业务监控、可视化大屏、接口数据输出等。

(5)DIM 维度层和其他

  • DIM:保存业务分析常用维度,如用户、商品、组织架构等,支持数据宽表和分析。
  • DMB/DML/TMP:部分企业还定义中间层、宽表层、临时层,作为特殊业务需要。

1.2 典型分层结构(示意图)

应用数据层(ADS) // 指标、标签、接口数据 ↑ 汇总数据层(DWS) // 各种汇总宽表 ↑ 明细数据层(DWD) // 清洗后标准化的明细表 ↑ 原始数据层(ODS) // 数据源原始快照 ↑ 数据源(OLTP等)

1.3 总结表格

层级简称关键作用粒度说明建议存储周期原始层ODS保留原始业务数据明细15-30天/看磁盘明细层DWD清洗、标准化、去重明细1-2年汇总层DWS多维汇总宽表/指标表主题/部门/时间等长期应用层ADS报表、接口、直接应用维度表/标签/聚合按需维度层DIM辅助分析的维度字典维度唯一性长期

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/13 3:31:51

【限时揭秘】Open-AutoGLM如何重构个人生产力系统,实现真正智能同步

第一章:Open-AutoGLM如何定义下一代个人生产力Open-AutoGLM 是一个开源的自动化语言生成框架,旨在通过自然语言驱动的任务编排能力,重新定义个体在数字世界中的操作边界。它将大语言模型的语义理解能力与可编程工作流深度融合,使用…

作者头像 李华
网站建设 2026/5/11 11:03:54

FaceFusion镜像资源占用监控:GPU显存使用情况

FaceFusion镜像资源占用监控:GPU显存使用情况在如今生成式AI应用快速落地的背景下,人脸替换技术已从实验室走向影视、社交、电商等多个实际场景。FaceFusion 作为一款功能强大且开源的人脸融合工具,凭借其高质量的换脸效果和灵活的部署方式&a…

作者头像 李华
网站建设 2026/5/12 2:39:04

Open-AutoGLM与Droidrun如何实现毫秒级响应?揭秘双系统协同优化黑科技

第一章:Open-AutoGLM与Droidrun双系统协同机制概述Open-AutoGLM 与 Droidrun 构成了一套面向移动智能体的异构协同计算架构,旨在融合大语言模型的语义理解能力与安卓运行时环境的操作执行能力。该架构通过标准化接口实现跨系统通信,支持任务解…

作者头像 李华
网站建设 2026/5/15 12:24:53

FaceFusion镜像通过UL认证:工业级稳定性

FaceFusion镜像通过UL认证:工业级稳定性 在AI生成内容(AIGC)迅速渗透影视、教育、直播等行业的今天,一个看似简单的“换脸”功能背后,早已不再是实验室里的炫技玩具。越来越多企业开始将人脸替换技术部署到生产环境中—…

作者头像 李华
网站建设 2026/5/9 6:48:40

炭黑分散度测试仪2025最新厂家推荐排行榜,专业实力与客户满

在炭黑生产与应用企业选择炭黑分散度测试仪时,常常会遇到“测试精度不足”“设备稳定性差”“售后技术支持不及时”等问题,严重影响生产效率与产品质量。基于对500 炭黑相关企业的调研,本次榜单从测试精度、设备稳定性、售后服务响应速度3大…

作者头像 李华
网站建设 2026/5/14 0:59:28

AnySoftKeyboard:解锁Android输入体验的全新境界

AnySoftKeyboard:解锁Android输入体验的全新境界 【免费下载链接】AnySoftKeyboard Android (f/w 2.1) on screen keyboard for multiple languages (chat https://gitter.im/AnySoftKeyboard) 项目地址: https://gitcode.com/gh_mirrors/an/AnySoftKeyboard …

作者头像 李华