news 2025/12/27 6:52:29

音频格式全解析:PCM到AAC

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
音频格式全解析:PCM到AAC

目录

一、PCM(最基础,必须懂)

✅ PCM 是什么?

PCM 的特点

PCM 的关键参数

PCM 示例(16bit)

二、WAV(PCM 的“盒子”)

✅ WAV 是什么?

WAV 的特点

WAV 文件结构

WAV vs PCM

三、MP3(有损压缩,体积小)

✅ MP3 是什么?

MP3 的特点

MP3 工作原理(简化)

常见码率

四、AAC(MP3 的升级版)

✅ AAC 是什么?

AAC 的特点

AAC 常见场景

AAC 类型

五、它们之间的关系(一图理解)

六、在 C++ 音视频学习中的真实用途


一、PCM(最基础,必须懂)

✅ PCM 是什么?

PCM(Pulse Code Modulation,脉冲编码调制)
👉最原始的音频数据格式,没有压缩。

你可以把 PCM 理解为:

声卡直接吐出来的声音数字

PCM 的特点

  • ❌ 没有文件头

  • ❌ 没有压缩

  • ✅ 音质最好

  • ❌ 体积最大

  • ✅ 所有音频格式的“原材料”

PCM 的关键参数

参数含义
采样率44100Hz / 48000Hz
采样位数16bit / 24bit
声道数1(单声道) / 2(立体声)
数据排列little endian

PCM 示例(16bit)

01 00 FF 7F 80 FF ...

👉在 C++ 里通常就是:

int16_t sample;

二、WAV(PCM 的“盒子”)

✅ WAV 是什么?

WAV = PCM + 文件头

它不是压缩算法,而是一个容器格式

WAV 的特点

  • 内部通常存的是 PCM

  • 有 RIFF / fmt / data 等头信息

  • 播放器可以直接识别

WAV 文件结构

| RIFF | fmt | data |

WAV vs PCM

对比PCMWAV
是否压缩
是否有头
能否直接播放

👉开发中常见场景:

  • 采集音频:PCM

  • 保存测试文件:WAV


三、MP3(有损压缩,体积小)

✅ MP3 是什么?

MP3 = 有损音频压缩格式

MP3 的特点

  • ✅ 有损压缩

  • ✅ 文件小

  • ❌ 音质有损

  • ❌ 不适合二次编辑

MP3 工作原理(简化)

  1. PCM 输入

  2. 心理声学模型(人听不见的丢掉)

  3. 频域压缩

  4. 输出 MP3

常见码率

  • 128 kbps(普通)

  • 192 kbps(较好)

  • 320 kbps(高质量)


四、AAC(MP3 的升级版)

✅ AAC 是什么?

AAC(Advanced Audio Coding)

AAC 的特点

  • ✅ 同等码率下比 MP3 音质好

  • ✅ 更适合流媒体

  • ✅ 延迟低

  • ❌ 编码解码复杂

AAC 常见场景

  • 视频音频(MP4)

  • 直播推流(RTMP / HLS)

  • 手机系统(iOS / Android)

AAC 类型

类型场景
AAC-LC最常用
HE-AAC低码率
HE-AAC v2极低码率

五、它们之间的关系(一图理解)

真实声音 ↓ PCM(原始数据) ↓ WAV(加壳保存) ↓ MP3 / AAC(压缩编码)

六、在 C++ 音视频学习中的真实用途

学习阶段你会用到
音频采集PCM
音频播放PCM / WAV
文件保存WAV
音频压缩MP3 / AAC
音视频同步AAC + H264
推流直播AAC
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/24 13:42:20

多模态大模型选型指南:为什么Open-AutoGLM成行业首选?

第一章:Open-AutoGLM 多模态理解行业排名在当前多模态人工智能技术快速发展的背景下,Open-AutoGLM 凭借其卓越的图文理解能力与高效的推理架构,在多个权威评测榜单中位列前茅。该模型由深度求索(DeepSeek)团队研发&…

作者头像 李华
网站建设 2025/12/22 22:50:28

从0到千万级部署:Open-AutoGLM开源方案节省成本的4个关键阶段

第一章:从0到千万级部署的成本演进全景在互联网产品的发展历程中,系统架构的演进与部署成本的变化密不可分。从最初的单机部署到如今支撑千万级用户的分布式架构,技术选型与基础设施投入经历了显著的跃迁。初创阶段:极简架构与低成…

作者头像 李华
网站建设 2025/12/23 1:33:23

FaceFusion如何处理带有玻璃反光的拍摄画面?

FaceFusion如何处理带有玻璃反光的拍摄画面?在智能终端设备日益普及的今天,越来越多用户习惯通过手机自拍完成身份验证、虚拟换脸或社交分享。然而一个常见却棘手的问题随之而来:当用户佩戴眼镜、隔着车窗拍照,甚至只是身处明亮室…

作者头像 李华
网站建设 2025/12/22 21:50:07

从零到实战:如何用Open-AutoGLM实现Appium无法覆盖的复杂测试场景?

第一章:从零到实战:Open-AutoGLM与Appium测试场景适配概览在移动应用自动化测试领域,传统基于UI控件识别的方案面临动态元素、跨平台兼容性等挑战。Open-AutoGLM作为一种结合大语言模型(LLM)语义理解能力的新型自动化框…

作者头像 李华
网站建设 2025/12/23 2:35:19

FaceFusion能否实现鼻子形状改变?三维结构精准映射

FaceFusion能否实现鼻子形状改变?三维结构精准映射在虚拟形象定制、AI美颜和数字人生成日益普及的今天,用户不再满足于简单的“换脸”——他们想要更精细的控制:比如把鼻梁调高一点,让鼻头更小巧一些。这种需求看似简单&#xff0…

作者头像 李华
网站建设 2025/12/23 0:17:04

FaceFusion是否支持批量处理?自动化脚本编写指南

FaceFusion是否支持批量处理?自动化脚本编写指南在AI内容创作日益普及的今天,人脸替换技术已从实验室走向大众应用。无论是社交媒体上的趣味头像生成,还是影视制作中的演员面部修复,高效、稳定的人脸交换工具都显得尤为重要。Face…

作者头像 李华