news 2026/6/8 22:11:21

动态调整IOU阈值

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
动态调整IOU阈值

Yolo5,pytorch数字仪表读数,准确率高达99%,自己所写算法。

最近用YOLOv5做了个超有意思的项目——工业数字仪表自动读数。这玩意儿在电力巡检场景实测准确率干到了99.2%,比之前用的传统方案强了不是一星半点。今天就跟大伙唠唠这个项目的实现细节,特别是自己魔改的那些关键代码。

先说数据这事儿,工业仪表最大的坑就是反光。我在数据增强里加了条特制的反射增强:

class SpecularReflection(albumentations.ImageOnlyTransform): def apply(self, img, **params): if random.random() < 0.3: h,w = img.shape[:2] kernel_size = random.randint(30,80) mask = np.zeros((h,w)) cv2.ellipse(mask, (w//2,h//2), (w//4,h//4), 0,0,360,255,-1) glow = cv2.GaussianBlur(mask, (kernel_size,kernel_size), 0) img = cv2.addWeighted(img, 1.0, cv2.cvtColor(glow,cv2.COLOR_GRAY2BGR), 0.6, 0) return img

这个变换在30%的图片里随机生成椭圆光斑,模拟金属表盘的反光效果。实测能让模型在强反光场景下的识别率提升18%左右。

模型结构上把YOLOv5s的neck改成了带SE注意力的双路径结构:

class DualPath(nn.Module): def __init__(self, c1, c2): super().__init__() self.cv1 = Conv(c1, c2//2, 3) self.cv2 = Conv(c1, c2//2, 3, dilation=2) self.attn = SEBlock(c2) def forward(self, x): return self.attn(torch.cat([self.cv1(x), self.cv2(x)], 1))

左边是常规卷积抓局部特征,右边用空洞卷积捕捉数字间的间距特征,最后接SE通道注意力加权。改完在密集数字场景的误检率从3.1%降到0.7%。

Yolo5,pytorch数字仪表读数,准确率高达99%,自己所写算法。

后处理部分魔改了非极大抑制:

def dynamic_nms(detections): sorted_ids = torch.argsort(detections[:,4], descending=True) keep = [] while sorted_ids.size(0): keep_id = sorted_ids[0] keep.append(keep_id) other_ids = sorted_ids[1:] overlap = bbox_iou(detections[keep_id][:4], detections[other_ids][:4]) iou_thres = 0.6 - 0.2 * (detections[keep_id][4] - 0.8) / 0.2 suppressed = torch.where(overlap > iou_thres)[0] sorted_ids = other_ids[~suppressed] return torch.tensor(keep)

这个动态阈值策略让低置信度的检测框用更宽松的IOU阈值,有效解决了数字粘连问题。调试时发现0.2这个系数最合适,改大改小都会影响召回率。

读数计算用了个挺有意思的加权算法:

def calc_value(digits): positions = [d[0] for d in digits] confidences = [d[1] for d in digits] sorted_digits = [d[2] for d in sorted(zip(positions, digits), key=lambda x:x[0])] total = 0 weight_sum = 0 for i, (digit, conf) in enumerate(sorted_digits): weight = conf * (10 ** (len(sorted_digits)-i-1)) # 位数权重 total += digit * weight weight_sum += weight return total / (weight_sum / 10**(len(sorted_digits)-1)) # 归一化

每个数字的置信度不仅影响自身可信度,还参与计算其所在数位的权重。比如高置信度的百位数会比低置信度的十位数更有话语权,这在部分数字被遮挡时特别管用。

踩过最大的坑是标注格式——小数点必须单独标注!刚开始把"12.3"标成[1,2,.,3]四个框,结果模型总把小数点和数字连起来认。后来改成将"12.3"整体标注并在属性里标记小数点位置才解决。

这个项目让我深刻体会到:工业场景的99%准确率比学术数据集的99.9%难得多。光是处理表盘污渍、水渍、反光这些幺蛾子就耗了两个月。不过看到机械臂终于能准确读取压力表数据时,真觉得值了。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/7 3:05:14

西部生态建设新范式:科技赋能重塑发展底色

来源&#xff1a;中国经营报 记者&#xff1a;索寒雪党的二十届四中全会审议通过的《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》锚定“完善适应气候变化工作体系”“扎实推动西部大开发形成新格局”等战略目标&#xff0c;为西部开发指明了新方向。当前&am…

作者头像 李华
网站建设 2026/6/6 9:33:16

对中国市场:短期信心提振,

中长期加速 “国产替代 生态分化”&#xff08;一&#xff09;AI 算力与云服务市场&#xff1a;短期缓解 “算力焦虑”&#xff0c;长期倒逼自主可控短期利好&#xff1a;H200/B30A 落地有望补充高端算力缺口&#xff0c;缓解云

作者头像 李华
网站建设 2026/6/7 2:29:28

从 “卖芯片” 转向 “稳生态 + 合规落地”

对英伟达自身&#xff1a;从 “卖芯片” 转向 “稳生态 合规落地” 核心目标&#xff1a;安抚客户 传递长期承诺 受美国出口管制影响&#xff0c;高端 GPU&#xff08;H100/H200 受限、Blackwell 系列禁售&#xff09;对华销售受阻&#xff0c;部分客户转向国产方案或调整技术…

作者头像 李华
网站建设 2026/6/9 18:30:26

基于ssm的人才信息管理系统设计与实现5bjg0k9y(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。

系统程序文件列表 开题报告内容 基于SSM的人才信息管理系统设计与实现开题报告 一、研究背景与意义 1.1 研究背景 随着经济全球化和信息技术的飞速发展&#xff0c;企业间的竞争日益激烈&#xff0c;人才已成为企业核心竞争力的重要组成部分。高效的人才管理不仅关乎企业的…

作者头像 李华