news 2026/3/17 6:24:04

磁盘空间清理 dd+rm 方案原理分析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
磁盘空间清理 dd+rm 方案原理分析

在导出.ova(Open Virtual Appliance,开源虚拟化镜像格式)前执行dd if=/dev/zero of=/empty bs=1M; rm /empty能大幅压缩镜像体积,核心原理是将虚拟机磁盘中的空闲扇区用0填充,让压缩算法能对连续0块进行高效压缩(甚至直接标记为空白跳过),解决了虚拟化环境中“空闲扇区数据杂乱导致压缩率低”的核心问题。

一、先搞懂:虚拟机磁盘的「伪空闲」问题

虚拟机的磁盘文件(如vmdk、qcow2,最终会被打包进.ova)有一个关键特性:删除文件后,磁盘的空闲扇区并非真正空白,而是保留了原文件的随机数据/碎片
原因在于:

  1. 操作系统删除文件时,仅修改文件系统的元数据(标记扇区为“可用”),不会擦除扇区中的实际数据;
  2. 虚拟机磁盘是「稀疏文件」(Sparse File)时,虽然未写入的扇区不会占用物理空间,但已写入后又释放的扇区,会保留原有数据并占据物理空间,且这些数据是随机的(如原文件的内容、缓存、日志碎片)。

而常规的压缩算法(如.ova默认的gzip压缩)对随机杂乱数据的压缩率极低(几乎压不动),但对连续的0字节压缩率接近100%(算法可直接用“N个0”的标记替代实际字节)。这是该清理方案的核心前提。

二、命令逐行解析:做了什么?

该命令是两步组合操作,核心是填充0→删除文件释放扇区,最终让虚拟机磁盘的空闲区域全为连续0。

1.dd if=/dev/zero of=/empty bs=1M

  • dd:Linux下的块设备数据拷贝工具,用于按指定大小读写数据;
  • if=/dev/zero:输入文件为/dev/zero(Linux特殊字符设备,无限输出0字节,无实际存储,仅在读取时生成0);
  • of=/empty:输出文件为当前根目录的empty,作用是用0字节填充这个文件
  • bs=1M:块大小为1MB,指定每次读写的字节数,决定填充速度(可根据磁盘性能调整,如4M、8M)。

执行效果:该命令会持续创建/empty文件,直到占满虚拟机磁盘的所有空闲空间(无可用扇区时自动停止),此时虚拟机磁盘中所有原本的空闲扇区都被0字节覆盖,原有的随机碎片数据被彻底替换。

2.rm /empty

  • rm /empty:删除刚创建的超大/empty文件;
  • 执行效果:操作系统标记/empty占用的扇区为“空闲”,但这些扇区的内容已经是连续的0字节,而非原来的随机数据。

三、核心逻辑:为什么填充0再删除,压缩率会暴增?

.ova的打包过程本质是将虚拟机磁盘文件、配置文件等打包并压缩,关键差异体现在填充0前后,空闲扇区的内容形态

状态空闲扇区内容压缩算法处理方式压缩后体积
未填充0随机碎片/原文件数据逐字节压缩,杂乱数据无规律,压缩率极低接近磁盘实际占用体积
填充0后删除连续0字节识别连续0块,用极简标记替代(如gzip的LZ77算法),几乎不占空间仅保留实际有数据的部分

简单来说:压缩算法对0的“压缩效率”是天花板级别的,而对随机数据几乎无效,该方案的本质是「将无意义的随机空闲扇区,转化为可被压缩算法极致优化的0扇区」。

总结

dd if=/dev/zero of=/empty bs=1M; rm /empty的核心原理可概括为「以空间换效率」:用0覆盖空闲扇区的随机数据,让压缩算法对连续0实现极致压缩,从而大幅降低.ova镜像的体积。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/14 6:22:08

2026专题直播第1期:如何快速搭建一个3D交互式场景?

2025年,我们连续做过几期专题直播,但后来因为其他工作耽误,就中断了较长一段时间。2026年,在时间允许的情况下,我们尽量多给你分享一些与GIS相关的行业专题直播。2026年第1期,我们联合上海漂视网络股份有限…

作者头像 李华
网站建设 2026/3/16 13:58:58

快看 !计算机专业包括哪些专业?计算机类18个专业全面解读,附就业方向,收藏这一篇就够了

计算机类专业介绍 在《普通高等学校本科专业目录(2020年版)》中,计算机专业是个大类,包括计算机科学与技术、软件工程、网络工程、信息安全、物联网工程、数字媒体技术****、智能科学与技术、空间信息与数字技术、电子与计算机工程…

作者头像 李华
网站建设 2026/3/10 2:37:25

又是跟AI学习的一天之带参数的装饰器

带参数的装饰器一般要写三层嵌套,示例# 第一层:接收装饰器参数 def require_permission(permission_codeNone, data_scope_checkFalse):# 第二层:接收被装饰的函数def decorator(fn):# 第三层:接收函数调用时的参数,并…

作者头像 李华
网站建设 2026/3/16 6:13:47

基于51单片机的智能散热风扇设计

摘要 基于51单片机的智能散热风扇的设计主要可以分为监测单元、控制单元和中央处理单元。本系统采用单片机STC89C52RC作为主控制器,采用数字型温度传感器DS18B20作为监测单元,主要就是采集温度数据,通过一系列的计算转化成实际温度数值。为了…

作者头像 李华
网站建设 2026/3/14 9:14:39

搬运机械手及其控制系统设计

第二章 总体方案确定 2.1 总体方案论证 机械手主要由执行机构、驱动系统、控制系统以及位置检测装置等所组成。 对气动机械手的基本要求是能快速、准确地拾一放和搬运物件,这就要求它们具有高精度、快速反应、一定的承载能力、足够的工作空间和灵活的自由度及在任意…

作者头像 李华
网站建设 2026/3/13 8:17:11

为什么自动化测试落地这么难?

最近一直在想一个问题,就是自动化测试落地为什么这么难? 想要找到原因首先我们要明确实施自动化测试的目的,价值,以及要解决的问题是什么?然后我们可以再进一步分析为什么自动化测试很难落地? 实施自动化…

作者头像 李华