news 2026/5/9 16:13:00

hive sql行转列,列转行sql的实例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
hive sql行转列,列转行sql的实例

在 Hive SQL 中,行转列和列转行是常见的数据转换操作。以下是详细说明和示例:

一、行转列(多行转多列)

场景:将同一分组下的多行数据合并为单行,不同值转为新列(如学生各科成绩横向展示)。

数据示例(student_scores):

student_idsubjectscore
1Math90
1English85
2Math92

目标(每个学生一行,科目成绩转为列):

student_idMathEnglish
19085
292NULL

SQL 实现

SELECT student_id, MAX(CASE WHEN subject = 'Math' THEN score END) AS Math, MAX(CASE WHEN subject = 'English' THEN score END) AS English FROM student_scores GROUP BY student_id;

关键点

  1. 使用CASE WHEN按条件生成新列
  2. 用聚合函数(如MAX/MIN/SUM)确保单行输出
  3. 必须配合GROUP BY分组字段

二、列转行(多列转多行)

场景:将单行的多列数据拆分为多行(如将横向科目成绩转为纵向记录)。

数据示例(student_scores_wide):

student_idMathEnglish
19085
292NULL

目标(恢复为行式存储):

student_idsubjectscore
1Math90
1English85
2Math92
2EnglishNULL

SQL 实现

SELECT student_id, 'Math' AS subject, Math AS score FROM student_scores_wide UNION ALL SELECT student_id, 'English' AS subject, English AS score FROM student_scores_wide;

优化方案(使用LATERAL VIEW explode(),Hive 特有):

SELECT student_id, subject, score FROM student_scores_wide LATERAL VIEW explode( map( -- 构建科目-分数的键值对 'Math', Math, 'English', English ) ) subjects AS subject, score;

关键点

  1. UNION ALL适合列数量固定的场景
  2. LATERAL VIEW + explode(map)动态处理多列
  3. 注意处理NULL值(Hive 中NULL会正常保留)

三、高级用法:动态行列转换

当列名不固定时(如新增科目),需结合 Hive 动态 SQL 或预处理:

  1. 行转列动态化
    使用collect_list+ 拼接字符串,再通过 UDF 解析(较复杂,通常需借助外部脚本生成 SQL)。
  2. 列转行动态化
    通过 Hive 元数据获取列名,动态生成UNION ALL语句(示例略,需依赖 Hive 变量或编程接口)。

总结对比

操作核心方法适用场景
行转列CASE WHEN+ 聚合函数 +GROUP BY固定列名,聚合统计
列转行UNION ALLLATERAL VIEW explode列数量少或需动态处理

提示:Hive 3.0+ 支持LATERAL VIEW inline(array_of_structs),但需先构造结构体数组。实际使用时请根据数据规模和复杂度选择合适方案。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 10:23:48

零样本语音克隆入门指南:使用GLM-TTS实现高保真音色复刻

零样本语音克隆入门指南:使用GLM-TTS实现高保真音色复刻 在虚拟主播一夜爆红、AI有声书批量生成的今天,一个关键问题正被越来越多开发者关注:如何用几秒钟的音频,复刻一个人的声音? 这不再是科幻电影的情节。随着深度学…

作者头像 李华
网站建设 2026/5/9 11:14:18

GLM-TTS常见问题汇总:从显存清理到批量失败应对

GLM-TTS实战指南:从显存溢出到批量任务失败的深度应对 在语音合成技术快速渗透内容生产的今天,越来越多团队开始尝试将大模型驱动的TTS系统集成进工作流。GLM-TTS凭借其零样本音色克隆能力,成为不少开发者构建个性化语音服务的首选工具。然而…

作者头像 李华
网站建设 2026/5/3 19:53:03

环境监测物联网系统实现全链路风险防控,让生产安全“看得见”

化工生产涉及易燃易爆、有毒有害物质,对生产环境与设备运行的监控要求极高。传统环境监测系统存在数据采集不全、预警不及时、远程控制能力弱等问题,一旦发生事故后果不堪设想。因此,实现车间环境的远程监控与控制,越来越成为化工…

作者头像 李华
网站建设 2026/5/9 13:17:14

毕业论文选题平台Top10最新排名与本科生选题方法指南

10大论文选题工具核心对比 排名 工具名称 核心功能 效率评分 适用场景 1 aicheck 智能选题大纲生成 ★★★★★ 完全无头绪时的选题生成 2 aibiye 选题优化可行性分析 ★★★★☆ 已有初步方向的优化调整 3 知网 学术资源库选题参考 ★★★★☆ 专业领域深度…

作者头像 李华