深度学习中的图像生成与时间序列聚类探索
1. CNN 与 DCGAN 概述
在图像分类任务中,我们训练的卷积神经网络(CNN)取得了令人瞩目的成果,最终准确率达到了 99.55%,超越了之前所尝试过的所有 MNIST 图像分类解决方案。接下来,让我们将目光转向深度卷积生成对抗网络(DCGAN),我们的目标是构建一个生成模型,用于生成与原始 MNIST 图像极为相似的合成图像。
为了生成近乎逼真的合成图像,我们需要训练两个关键组件:一个是生成器,它能够从原始 MNIST 图像中学习并生成新的图像;另一个是判别器,其作用是判断生成的图像是否与原始图像足够相似。可以这样理解,原始 MNIST 数据集代表了原始的数据分布,生成器从这个分布中学习并基于所学内容生成新图像,而判别器则尝试判断新生成的图像是否与原始分布几乎无法区分。
2. DCGAN 生成器架构
对于生成器,我们将采用 Radford、Metz 和 Chintala 在 2016 年 ICLR 会议上提出的架构。生成器首先接收一个初始噪声向量,这里表示为一个 100 x 1 的噪声向量 z,然后将其投影并重塑为一个 1024 x 4 x 4 的张量。这个过程与卷积相反,被称为转置卷积(在某些情况下也称为反卷积),它将一个较小的张量映射到一个较大的张量。
在初始的转置卷积之后,生成器会应用四个额外的反卷积层,最终映射到一个 64 x 3 x 3 的张量。具体的转换阶段如下:
100 x 1 → 1024 x 4 x 4 → 512 x 8 x 8 → 256 x 16 x 16 → 128 x 32 x 32 → 64 x 64 x 3
在设计 MNIST