医学图像本科毕设实战指南：从数据预处理到模型部署的完整技术链路-洪萨配资

医学图像本科毕设实战指南：从数据预处理到模型部署的完整技术链路 ================================================----

摘要：很多本科同学第一次做医学图像毕设，都会卡在“数据长什么样”“模型怎么选”“代码怎么写得像工业级”这三连击上。本文用肺部 CT 分割当主线，把 DICOM 解析、小样本增强、轻量模型对比、Flask+Docker 部署串成一条可落地的链路。全部代码按 Clean Code 要求拆成函数，复制即可跑通；指标、异常、内存、类别不平衡等坑也一次性打包说明。照着做，两周就能把“能跑”升级成“能秀”。

1. 医学图像的“坑”从数据开始

DICOM ≠ jpg：像素值是 12/16 bit，还自带窗宽窗位、方向矩阵、Slice Thickness 等元信息，直接丢进 OpenCV 会爆灰。
样本少：公开集 LIDC-IDRI 只有 1 018 套 CT，能用的肺结节切片不到 6 万张，远少于 ImageNet。
标注错：医生勾的轮廓常带锯齿，边缘像素误差 1-2 mm，训练时当成 GT 会带偏模型。
三维不一致：层厚 1 mm 和 5 mm 混一起，插值后要么锯齿要么糊，必须重采样到统一体素间距。

2. 技术选型：PyTorch vs TensorFlow + 轻量模型

维度	PyTorch 2.x	TensorFlow 2.x
调试友好	动态图，pdb 随停随看	静态+tf.function，调试靠 tf.print
医学社区	MONAII、TorchIO 即装即用	TF 官方无专属医学库
部署生态	torchserve 轻量，ONNX 通用	TF Serving 成熟，但镜像 3 GB+

结论：本科阶段优先 PyTorch，代码量少一半。

轻量化模型对比（输入 512×512，单类分割）：

模型	参数量	Dice↑	推理延迟↓(RTX3060)	备注
U-Net baseline	31 M	0.912	38 ms	太重，毕设笔记本 GPU 易炸
U-Net+MobileNetV3 编码	2.1 M	0.903	11 ms	通道剪枝后体积 < 8 MB，手机端可跑
U-Net+EfficientNet-Lite0	3.9 M	0.908	14 ms	折中方案，TFLite 友好

建议：毕设选 MobileNetV3 版 U-Net，论文里写“轻量+实时”容易过审。

3. 核心代码：从 DICOM 到 REST API

下面代码全部单文件可跑，按“函数职责单一”拆，方便直接嵌进毕设 repo。

3.1 DICOM 读取 + 窗宽窗位调整

# data_utils.py import pydicom, numpy # 1.10+ import SimpleITK as sitk def read_dicom_series(folder_path): """读取一整套CT，返回3D数组与体素间距""" reader = sitk.ImageSeriesReader() dicom_names = reader.GetGDCMSeriesFileNames(folder_path) reader.SetFileNames(dicom_names) image = reader.Execute() spacing = image.GetSpacing() # (x,y,z) arr = sitk.GetArrayFromImage(image) # (z,y,x) return arr.astype(np.float32), spacing def set_window(arr, center=-600, width=1500): """把HU值转成0-255灰度，适配可视化与CNN输入""" min_val = center - width // 2 max_val = center + width // 2 arr = np.clip(arr, min_val, max_val) arr = (arr - min_val) / width * 255 return arr.astype(np.uint8)

3.2 重采样 + 2D 切片生成

def resample_to_uniform(arr, old_spacing, new_spacing=[1.0, 1.0, 1.0]): """统一体素间距，减少z轴厚薄差异""" resize_factor = np.array(old_spacing) / np.array(new_spacing) new_shape = np.round(arr.shape * resize_factor).astype(int) return scipy.ndimage.zoom(arr, resize_factor, order=1), new_spacing def extract_slice_pairs(volume, mask, stride=2): """每隔stride层取一张切片，保证相邻切片相似度别太高""" z_len = volume.shape[0] for idx in range(0, z_len, stride): yield volume[idx], mask[idx] # 返回2D图+标注

3.3 数据增强（小样本救星）

from torchvision import transforms train_tf = transforms.Compose([ transforms.RandomRotation(10), transforms.RandomResizedCrop(512, scale=(0.8, 1.0)), transforms.ColorJitter(brightness=0.2, contrast=0.2), transforms.ToTensor() ])

经验：医学图颜色抖动幅度别超过 0.2，否则 HU 分布被拉偏，Dice 掉 2-3 个点。

3.4 轻量 U-Net 定义（MobileNetV3 编码）

# model.py import torch, torch.nn as nn from torchvision.models import mobilenet_v3_large class MobileUNet(nn.Module): def __init__(self, n_classes=1): super().__init__() backbone = mobilenet_v3_large(pretrained=True).features self.enc1 = backbone[:3] # 16 ch self.enc2 = backbone[3:6] # 24 self.enc3 = backbone[6:12] # 40 self.enc4 = backbone[12:] # 112 # 解码器 self.dec4 = nn.ConvTranspose2d(112, 40, 2, stride=2) self.dec3 = nn.ConvTranspose2d(40, 24, 2, stride=2) self.dec2 = nn.ConvTranspose2d(24, 16, 2, stride=2) self.head = nn.Conv2d(16, n_classes, 1) def forward(self, x): e1 = self.enc1(x) e2 = self.enc2(e1) e3 = self.enc3(e2) e4 = self.enc4(e3) d4 = self.dec4(e4) + e3 d3 = self.dec3(d4) + e2 d2 = self.dec2(d3) + e1 return torch.sigmoid(self.head(d2))

3.5 训练主循环（含 DiceLoss）

class DiceLoss(nn.Module): def forward(self, pred, target, smooth=1e-5): pred = pred.view(-1) target = target.view(-1) intersection = (pred * target).sum() return 1 - (2.这儿intersection + smooth) / (pred.sum() + target.sum() + smooth) def train_one_epoch(model, loader, optim, loss_fn, device): model.train() for img, mask in loader: img, mask = img.to(device), mask.to(device) pred = model(img) loss = loss_fn(pred, mask) optim.zero_grad() loss.backward() optim.step()

3.6 Flask 推理服务（带输入校验）

# app.py from flask import Flask, request, jsonify import numpy as np, cv2, torch, io from PIL import Image app = Flask(__name__) model = torch.load('mobilenet_unet.pth', map_location='cpu').eval() def preprocess(file_stream): """只做最小必要处理，防止用户传非图""" try: img = Image.open(file_stream).convert('L') arr = np.array(img.resize((512, 512))) arr = arr.astype(np.float32) / 255.0 return torch.from_numpy(arr).unsqueeze(0).unsqueeze(0) except Exception as e: raise ValueError("非法图像数据") from e @app.route('/predict', methods=['POST']) def predict(): if 'file' not in request.files: return jsonify(error="缺失file字段"), 400 try: tensor = preprocess(request.files['file']) with torch.no_grad(): out = model(tensor) mask = (out.squeeze().numpy() > 0.5).astype(np.uint8) * 255 _, buf = cv2.imencode('.png', mask) return jsonify(success=True, mask_b64=buf.tobytes().hex()) except Exception as e: return jsonify(error=str(e)), 500

3.7 Docker 化（CPU 版 < 400 MB）

FROM python:3.10-slim COPY requirements.txt . RUN pip install -r requirements.txt COPY app.py model.pth / CMD ["gunicorn", "-b", "0.0.0.0:8000", "app:app", "-k", "gevent", "--workers", "2"]

构建 & 运行：

docker build -t lung-seg:latest . docker run -dp 8000:8000 lung-seg:latest

4. 指标与上线安检清单

Dice 系数：验证集 ≥ 0.90 才能给导师演示；低于 0.85 先回去重看窗宽和重采样。
推理延迟：单张 512×512 在 RTX3060 上应 < 15 ms；CPU 版 < 250 ms，否则加 ONNX+TensorRT 再压。
输入校验：除文件后缀外，再读文件头 8 字节校验 PNG/JPG 魔数；拒绝非灰度图直接返回 415 400。
异常处理：所有 try/except 必须打日志（时间、IP、traceback），防止线上黑盒崩溃。
安全加固：/predict 接口加 4 位随机 token，毕业答辩现场防同学“随手点”。

5. 生产环境避坑指南

GPU 内存溢出：MobileUNet 仅 2.1 M，但 batch_size 仍要从 1 开始试；训练阶段把 num_workers 设 0 可避开 Docker for Win 的共享内存 Bug。
类别不平衡：肺/背景 ≈ 1:20，用 DiceLoss 自带平衡，不必再额外加权；如果任务多类，再补 FocalLoss。
过拟合：数据增强别用力过猛，旋转 > 15° 会让解剖结构失真；早停 patience 设 10 轮，省得半夜调。
推理结果空洞：模型输出 0/1 后加 3×3 中值滤波，可去掉孤立噪点，肉眼观感提升 30%。
版本锁定：requirements.txt 里 pydicom==2.4.2，别写 latest，否则明年学弟复现直接红字报错。