硬件产品可靠性设计与元器件降额设计,这两者是构建高可靠、长寿命硬件产品的基石,尤其在工业、汽车、医疗、通信及航空航天等领域至关重要。
一、核心理念与标准
1. 设计目标
不是“永不损坏”,而是在规定的生命周期、规定的环境条件下,以规定的置信度完成规定功能。
核心矛盾:在可靠性、性能、成本、体积、开发周期之间取得最佳平衡。
2. 指导思想:预防而非补救
可靠性是“设计出来”的,不是靠后期筛选或维修获得的。
在设计阶段,通过降额、冗余、容错、环境防护等手段,将潜在的失效模式消除或控制在可接受范围内。
3. 遵循的标准
国内/军用:GJB/Z 35《元器件降额准则》、GJB 450A《装备可靠性工作通用要求》。
国际/行业:
MIL-HDBK-217F(美军标,可靠性预测)。
Telcordia SR-332(通信行业)。
IEC/ISO 标准(如IEC 61508功能安全)。
汽车电子:AEC-Q系列认证, ISO 26262功能安全。
核心原则:若无特定行业标准,按最严酷的预期应用环境提升一个等级进行设计。
二、硬件产品系统级可靠性设计
1. 环境适应性设计
| 环境应力 | 设计对策 |
|---|---|
| 温度 | -选用宽温器件(工业级:-40℃~85℃/105℃; 汽车级:-40℃~125℃)。 -热设计:计算结温, 确保 TJ<TJmax−裕量TJ<TJmax−裕量; 使用散热片、导热垫、热过孔。 -低温考虑:电解电容ESR增大, MLCC容量减小, 需验证性能。 |
| 湿度/凝露 | -三防漆(Conformal Coating)保护。 -灌封(Potting)用于极端环境。 - 选用防潮等级高的封装。 |
| 振动/冲击 | -机械加固:板卡加强筋, 大质量/高大器件使用硅胶/螺丝固定。 -器件选型:避免使用大型铝电解电容; MLCC选用柔性端接(Soft Termination)型号。 -布局:大器件远离板边和安装孔。 |
| 灰尘/腐蚀 | - 密封机箱, 使用防尘网。 - 连接器选用带密封圈型号。 |
| EMC(电磁兼容) | -屏蔽:完整屏蔽腔, 屏蔽罩接地良好。 -滤波:电源入口、信号接口处使用π型滤波、共模扼流圈、TVS。 -接地:单点接地(模拟)、多点接地(数字), 保证低阻抗回流路径。 |
2. 电路保护设计
过压保护:TVS管、稳压二极管、压敏电阻(MOV)。
过流保护:自恢复保险丝(PPTC)、熔断器、电子保险丝(eFuse)。
反向保护:二极管、MOSFET防反接电路。
ESD保护:在所有外部接口(USB, HDMI, 按键, 端子)放置ESD器件(如TVS阵列), 遵循“就近”原则。
冗余设计:
并联冗余:对关键电源路径, 使用二极管“ORing”电路或MOSFET实现冗余供电。
功能冗余:关键信号或传感器有备份。
3. 状态监测与健康管理
监控参数:输入/输出电压电流、关键点温度(NTC/PTC)、风扇转速。
看门狗:必须有独立硬件看门狗, 防止软件跑飞。
上电复位与掉电检测:确保电源稳定后再让CPU启动。
三、元器件降额设计(核心干货)
降额定义:使元器件在实际工作中承受的应力(电、热、机械)低于其额定最大应力, 以降低失效率, 延长寿命。
降额等级(通常参考GJB/Z 35)
Ⅰ级降额:最大程度降额, 适用于高可靠、关键任务、维修困难的产品(如航天、医疗)。
Ⅱ级降额:中等降额, 适用于工业、通信等要求高可靠性的产品。这是绝大多数商业高可靠性产品的目标。
Ⅲ级降额:最小降额, 适用于消费类等对体积成本敏感, 且故障后果不严重的产品。
降额等级的不同应用
通用降额准则表(针对Ⅱ级降额)
| 元器件类别 | 降额参数 | 推荐降额范围(工作值/额定值) | 关键说明与计算 |
|---|---|---|---|
| 电阻 | 功率 | ≤60%@ 70°C壳温 随温度升高需进一步降额 | 参考厂家提供的“功率-温度降额曲线”。金属膜、厚膜电阻稳定性好。 |
| 电压 | ≤75% | 注意高压应用, 防止爬电。 | |
| 瞬时过载 | 符合浪涌规格 | ||
| 电容 | 电压(DC) | 铝电解: ≤80% 钽电容(MnO2): ≤50%(严格要求!) 聚合物钽/铝: ≤80-90% MLCC(X7R, X5R): ≤50%(考虑直流偏压效应) MLCC(C0G): ≤80% | 最易出错环节! 1.钽电容: 必须强降额, 且需串联电阻限流。 2.MLCC: 实际有效容量随直流电压升高而暴跌, 必须查“DC Bias”曲线。 3.纹波电流: 实际纹波电流 < 额定纹波电流(通常≤70%)。 4.温度: 实际工作温度 < 额定温度(如105°C电容用于85°C环境)。 |
| 纹波电流 | ≤70% | 计算总RMS纹波电流, 高温下需进一步降额。 | |
| 温度 | 低于额定温度10-20°C | ||
| 电感/变压器 | 电流 | 温升电流(Irms)≤80% 饱和电流(Isat)≤70% | 在最大工作温度下, 实际RMS电流应小于Irms; 峰值电流应小于Isat。 |
| 温度 | 绕组热点温度 ≤ 绝缘等级-20°C | ||
| 二极管 | 反向电压 | ≤70% | 瞬态反向峰值电压(VRRM)也需降额。 |
| 正向电流 | ≤70%(平均) | 考虑热阻和壳温。 | |
| 浪涌电流 | ≤90%(单次) | 查IFSM参数。 | |
| 晶体管/MOSFET | 集电极-发射极电压 漏-源电压 | ≤75% | |
| 集电极/漏极电流 | ≤70%(连续) | ||
| 功耗(Pd) | ≤50%@ 壳温25°C | 最关键!计算 TJ=TC+(RθJC×PD)TJ=TC+(RθJC×PD), 确保 TJ<TJ< 最大结温-裕量(如125°C器件, 设计目标≤100°C)。 | |
| 结温 | ≤80%of Tjmax | 例如Tjmax=150°C, 则设计目标≤120°C。 | |
| 集成电路 | 电源电压 | ≤90% | 注意模拟电路(如运放)对电压裕度要求更高。 |
| 输出电流 | ≤80% | ||
| 结温 | ≤80%of Tjmax | 同上, 高温是IC主要失效诱因。 | |
| 频率 | ≤90%(如需) | ||
| 继电器/开关 | 触点电流 | 阻性负载: ≤75% 感性负载: ≤40%(需加缓冲电路) | 感性负载会产生巨大电弧, 必须大幅降额或保护。 |
| 触点电压 | ≤75% | ||
| 线圈电压 | 按规格, 确保完全吸合 | ||
| 连接器 | 电流 | 每引脚≤50%额定电流 | 考虑温升和接触电阻老化。多引脚并联可提升, 但需谨慎。 |
| 电压 | ≤50%(尤其高海拔应用) | 高海拔时空气稀薄, 耐压降低。 |
3.1电容降额
一、工作电压电容在规定的温度范围内可靠地工作时,电容两端的电压。
二、反向电压使用示波器得出的测量值可能是正值,也可能是负值,与探头正负极的接法有关。如果差分探头的正极接到了电容的正极,那么测试得出的负值就是电容上的反向电压;如果相反,那么测试得出的正值就是电容上的反向电压。除了关注电容的最大工作电压、平均工作电压外还应该注意反向电压。
三、壳体温度电容外壳最热点的温度(通常为靠近发热元件的部位),如果无法确定,则可以统一测试电容顶端处的温度。
3.2电阻降额
一、工作温度电阻的工作温度降额需要测试电阻的壳温,对于小封装的非功率电阻可以测试电阻旁的PCB来代替壳温。
3.3三极管降额
一、电流 ICEO指基极开路时,集电极和发射极间的电流,称为集电极穿透电流。
二、电压 VCES指三极管饱和导通时,C、E间的电压,称为饱和压降。通常把VCE=VBE(即集电结零偏)时称为临界饱和,当VCE<VBE时,三极管进入饱和区。
三、耗散功率 PCM集电结最大允许耗散功率。晶体管工作时,集电结要承受较高的电压并流过较大电流,在集电结上要消耗一定的功率,从而导致集电结发热、结温升高。当结温过高时,管子的性能下降,甚至烧坏管子,PCM就是集电结因受热而引起管子参数变化不超过规定值时,集电结耗散的最大功率。
四、击穿电压场效应管的V(BR)DSS指在栅级开路时,漏级和源级之间的击穿电压。
五、结温三极管和场效应管的温度降额需要测试器件壳温,然后根据功耗和热阻计算出结温进行降额审查。
3.4二极管降额
一、正向电流二极管长期工作时所允许通过的最大正向平均电流,也称最大整流电流。实际使用时,二极管的平均电流不能超过此值。
二、反向电压二极管在使用时所允许加的最大反向电压,也称反向峰值电压。超过此值容易发生反向击穿或反向电流过大。通常取反向击穿电压VBR)的一半作为VRM。
三、耗散功率二极管的额定功耗,它是由管子温升所限定的参数,与PN结所用的材料、结构及工艺有关。使用时不允许超过此值。
四、最高结温二极管温度降额审查时需要在器件工作达到热平衡时,用点温计测量其最热处的壳温并根据热阻和功耗计算出结温来进行审查,对于小封装的贴片器件如果不方便测量可以测量器件旁的PCB代替。
3.5微电路、集成电路降额
一、扇出数 由于数字电路输出有高电平和低电平两种可能,因此要分别计算高电平的扇出数和低电平的扇出数,然后取两者中小的那一个。扇出数的计算主要是考虑集成电路输出端电流的驱动能力。
二、输出电流 一般是总线信号和模拟器件需要考虑输出电流的降额,对于总线信号可实际就是最大扇出数的要求。实际输出电流通过实际测量或计算得到。
三、电源电压 一般放大器、比较器、电压调整器和模拟开关对输入电压都有一定的要求。
四、输入输出电压差 一般电压调整器对输入输出的电压差都有一定的要求。
五、结温 微电路类器件温度降额审查时需要测试器件壳体的温度,之后根据热阻和功耗换算出器件结温进行审查。
3.6磁器件降额
3.7晶体、晶振降额
3.8连接器与线缆降额![]()
3.9保护器件降额
3.10继电器降额
3.11开关、断路器降额
3.12EMI滤波器降额
3.13光耦降额
3.14光收发器降额
3.15风扇降额![]()
3.16电源模块降额
其他还需要降额的器件有:
振荡器、光模块、导线、硬盘、无线射频器件、电池、PCB等等,这里就不一一介绍了。
四、降额设计工程实施流程
Step 1: 定义产品规格与环境 Profile
明确工作温度范围、输入电压波动范围、负载瞬态特性、振动等级、寿命要求(如MTBF > 100,000小时)。
Step 2: 创建降额设计规范
基于公司标准或参考GJB/Z 35, 制定内部《降额设计准则》,明确各级产品的降额等级(Ⅰ/Ⅱ/Ⅲ)和各元器件类的具体降额参数。
Step 3: 原理图设计阶段应用
选型时:直接选择额定值满足降额要求的器件。例如, 5V电源轨, 选用至少10V(5V/50%)额定电压的MLCC。
计算验证:对功率器件(MOSFET, LDO, 电感)、关键电容(纹波电流、电压)进行应力计算。
Step 4: 热设计与仿真
使用热仿真软件(如FloTHERM, Ansys Icepak)或在设计后计算最恶劣情况下的结温。
准则:在最高环境温度下, 任何元器件的结温/热点温度不得超过降额后的目标温度。
Step 5: PCB设计实现
布局:发热器件远离敏感器件, 均匀分布。
散热:为功耗>0.5W的器件设计足够大的铜皮散热面积和热过孔。
布线:大电流路径足够宽, 避免瓶颈。
Step 6: 设计评审与检查
组织专门的可靠性设计评审, 使用降额检查清单逐项核对。
Step 7: 测试验证
高温老化试验:在最高工作温度下满载运行至少96小时。
温度循环试验:验证材料界面(如BGA焊点)的可靠性。
HALT:高加速寿命试验, 寻找设计薄弱点。
五、可靠性/降额设计检查清单(精简版)
总体:已制定并遵循明确的《降额设计准则》。
环境:所有元器件温度等级覆盖了产品最高工作温度+裕量。
电源:
输入电压波动范围在IC允许范围内, 且有瞬态过压保护。
所有电容(特别是MLCC、钽电容)的工作电压 ≤ 降额后的额定电压。
功率电感/变压器的饱和电流与温升电流均满足降额要求。
半导体:
晶体管/MOSFET/二极管的电压、电流、功耗、结温均满足降额要求。
LDO/DC-DC的功耗已计算, 结温在安全范围内。
保护:
所有外部接口有ESD/TVS保护。
电源入口有防反接、过压、过流保护。
感性负载(继电器、电机)有缓冲/钳位电路。
PCB与热:
大电流走线宽度经过计算。
主要发热器件有合理的散热设计(铜皮、过孔、散热器)。
已完成或计划进行热仿真/测试。
文档:所有降额计算和关键器件选型依据已记录归档。
六、关键提醒与常见陷阱
降额不是越狠越好:过度降额可能导致器件无法正常工作(如MOSFET栅极电压不足)、成本剧增、体积过大。
系统思考:一个器件的降额可能影响其他部分。例如, 为降低LDO功耗而降低其输入电压, 需确保前级DCDC仍能稳定输出。
关注失效模式:电容关注电压和温度; MOSFET关注导通损耗和开关损耗; 连接器关注电流和插拔次数。
重视“隐性”应力:如MLCC的直流偏压、机械应力(PCB弯曲导致开裂)、焊点疲劳(温度循环)。
数据手册是根本:一切降额计算必须基于器件最新的官方数据手册, 尤其是那些特性曲线图(温升、SOA、DC Bias)。
最终哲学:硬件可靠性设计是一场与“概率”和“环境”的战争。通过科学地降额, 我们显著降低了元器件在预期寿命内失效的概率, 从而将系统的整体可靠性提升到可接受的水平。这是一项需要严谨、经验和持续优化的工程实践。