在大模型班学算法的笔记记录-模糊+深度学习-洪萨配资

在深度学习中，数据增强是提升模型泛化能力的核心手段之一。将模糊处理与深度学习结合，既能保留图像核心特征，又能强化模型的特征提取能力，是一种高效的图像数据增强思路。

一、模糊在深度学习数据增强中的应用思路

模糊处理用于数据增强的核心逻辑是：模糊图像会保留主体特征，弱化细节干扰，迫使模型学习更本质的特征。主要有两种实现方式：

生成纯模糊图像：对原始图像随机施加不同类型、不同尺度的模糊，直接作为增强数据；
模糊图像与原图融合：将模糊后的图像与原始图像按比例混合（mixup），兼顾特征保留与数据多样性（模糊尺度建议设置得更大，增强效果更显著）。

二、核心技术实现：随机模糊处理

功能说明

随机选择模糊核尺寸（3/5/7/9/11/15），随机选择模糊类型（中值模糊、均值模糊、高斯模糊），对图像进行模糊处理。

代码实现与注解

import cv2 import random import numpy as np # 辅助函数：显示图像（调试用） def show(img, title=''): cv2.imshow(title, img) cv2.waitKey(0) cv2.destroyAllWindows() # 补充：避免窗口残留 # 核心函数：随机模糊处理 def rnd_blur(image): # 1. 随机选择模糊核尺寸（奇数，符合OpenCV模糊函数要求） k_size = random.choice([3,5,7,9,11,15]) # 2. 随机生成0-1的浮点数，用于选择模糊类型 ratio = random.uniform(0, 1) blur_img = None # 初始化模糊图像变量 # 3. 按概率随机选择模糊类型 if ratio < 0.3: # 中值模糊：适合去除椒盐噪声，保留边缘 blur_img = cv2.medianBlur(image, k_size) elif 0.3 <= ratio < 0.6: # 均值模糊：简单平均，整体平滑 blur_img = cv2.blur(image, (k_size, k_size)) else: # 高斯模糊：模拟自然模糊，平滑效果更自然 blur_img = cv2.GaussianBlur(image, (k_size, k_size), 0) return blur_img # 测试随机模糊函数 if __name__ == "__main__": # 读取测试图像（BGR格式，OpenCV默认） path = r"/Users/yangjunhui/Desktop/lenaNoise.png" img1 = cv2.imread(path) # 生成模糊图像 bgr_blur = rnd_blur(img1) # 显示结果 show(bgr_blur, 'Random Blur Image')

关键函数注解

random.choice(seq)：从列表/元组等可迭代对象中等概率随机选择一个元素（此处选模糊核尺寸）；
random.uniform(a, b)：生成[a, b)范围内的均匀分布随机浮点数（此处用于分配模糊类型概率）；
cv2.medianBlur(img, ksize)：中值模糊，ksize为模糊核尺寸（必须是奇数）；
cv2.blur(img, (ksize, ksize))：均值模糊，参数为模糊核的宽高（通常设为相同奇数）；
cv2.GaussianBlur(img, (ksize, ksize), 0)：高斯模糊，最后一个参数为X方向高斯核标准差（设为0则自动根据核尺寸计算）。

三、核心技术实现：图像混合（mixup）

1. mixup基础原理

将两张图像按固定权重融合，公式为：融合图 = 图A×权重A + 图B×权重B + 亮度调节值。

优点：提升模型对目标的检出率，帮助模型“涨点”（准确率/精度提升）；
缺点：可能轻微提高误检率（需平衡权重控制）。

2. 基础实现：两张图像尺寸统一与融合

# 读取两张测试图像 img1 = cv2.imread(r"/Users/yangjunhui/Desktop/lenaNoise.png") img2 = cv2.imread("./imgs/20230925144601.jpg") # 步骤1：统一尺寸（以img1为基准） h, w = img1.shape[:2] # 获取img1的高度、宽度（shape[:2]：取前两个维度） img2 = cv2.resize(img2, (w, h)) # 将img2调整为与img1相同尺寸（dsize=(宽, 高)） # 方式1：手动加权融合（需转换数据类型避免溢出） last_img = (img2 * 0.5 + img1 * 0.5).astype(np.uint8) # 方式2：OpenCV内置函数（自动处理数据类型，更高效稳定） last_img = cv2.addWeighted(img2, 0.5, img1, 0.5, 0) # 显示融合结果 show(last_img, 'Mixup Image')

3. 封装为通用mixup函数

def mixup(img1, img2): """ 两张图像的mixup融合（统一尺寸后按0.5:0.5权重融合） :param img1: 基准图像（参考尺寸） :param img2: 待融合图像 :return: 融合后的图像 """ h, w = img1.shape[:2] img2 = cv2.resize(img2, (w, h)) # 统一尺寸 # cv2.addWeighted参数说明：img1, 权重1, img2, 权重2, 亮度调节值(gamma) mix_img = cv2.addWeighted(img2, 0.5, img1, 0.5, 0) return mix_img

四、进阶实现：模糊图像与原图的mixup融合

功能说明

先对原始图像做随机模糊，再将模糊图像与原图按随机权重（0.3~0.7）融合，兼顾随机性与增强效果。

封装函数实现

def blur_mixup(img): """ 模糊图像与原图的mixup融合 :param img: 原始图像 :return: 模糊+融合后的增强图像 """ # 步骤1：对原图做随机模糊 blur_img = rnd_blur(img) # 步骤2：随机生成融合权重（模糊图权重0.3~0.7，原图权重为1-该值） blur_ratio = random.uniform(0.3, 0.7) # 步骤3：加权融合 mix_img = cv2.addWeighted(blur_img, blur_ratio, img, 1 - blur_ratio, 0) return mix_img # 测试模糊+融合增强 if __name__ == "__main__": img = cv2.imread(r"/Users/yangjunhui/Desktop/lenaNoise.png") enhanced_img = blur_mixup(img) show(enhanced_img, 'Blur + Mixup Image')