news 2026/4/19 12:33:26

基于主成分分析与概率神经网络的预测模型研究

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于主成分分析与概率神经网络的预测模型研究

预测:基于主成分分析(PCA)和概率神经网络(PNN)预测。

数据预测这事儿吧,有时候就像在菜市场挑西瓜——数据维度一多,敲瓜都得敲半天。这时候就需要主成分分析(PCA)来帮我们把西瓜拍个X光,只留下关键特征。不过光降维还不够,预测这事儿还得靠神经网络,而概率神经网络(PNN)这种能直接输出概率的模型,倒是挺适合实战场景。

先上代码热个身。咱们用sklearn自带的葡萄酒数据集,13个特征直接开干:

from sklearn.datasets import load_wine from sklearn.preprocessing import StandardScaler data = load_wine() X, y = data.data, data.target scaler = StandardScaler() X_scaled = scaler.fit_transform(X) print("原始特征维度:", X_scaled.shape[1])

跑完这段能看到原始数据有13个特征。接下来咱们请出PCA这个降维狂魔:

from sklearn.decomposition import PCA pca = PCA(n_components=0.85) # 保留85%的信息量 X_pca = pca.fit_transform(X_scaled) print("降维后特征数:", X_pca.shape[1])

这里有个骚操作——n_components可以填小数,表示保留多少比例的信息量。跑完发现维度从13降到8,相当于把西瓜的纹路、颜色、声音这些特征压缩成"甜度指数"、"脆度系数"几个核心指标。

接下来才是重头戏。PNN这玩意儿在sklearn里没现成的,不过咱们可以用TensorFlow魔改一个简易版。重点在于输出层用softmax激活,把预测变成概率游戏:

import tensorflow as tf model = tf.keras.Sequential([ tf.keras.layers.Dense(32, activation='relu', input_shape=(X_pca.shape[1],)), tf.keras.layers.Dropout(0.3), # 防止网络学得太high tf.keras.layers.Dense(len(set(y)), activation='softmax') ]) model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

这段代码里有几个小心机:Dropout层像给网络戴了个眼罩,防止它死记硬背训练数据;softmax层把输出变成概率分布,比如预测结果可能是[0.2, 0.7, 0.1],直接看出第二类的概率最高。

训练时咱们得盯着验证集的曲线,防止过拟合:

history = model.fit(X_pca, y, epochs=100, validation_split=0.2, verbose=0) # 画个训练过程瞅瞅 import matplotlib.pyplot as plt plt.plot(history.history['accuracy'], label='训练集') plt.plot(history.history['val_accuracy'], label='验证集') plt.legend() plt.show()

如果看到验证集曲线开始跳水,赶紧按Ctrl+C止损。实际跑下来发现,用PCA处理后的数据训练,收敛速度比原始数据快了一倍不止,验证集准确率还能保持在95%左右。

不过要注意的是,PCA不是万能药。某次我把信息保留率调到60%,结果模型准确率直接血崩——就像把西瓜拍成二维码,连瓜瓤颜色都看不清了。建议新手先用pca.explainedvarianceratio_看看各个主成分的含金量,别上来就无脑降维。

最后来个预测示例收尾:

sample = X_pca[0:1] # 拿第一个样本试试 prob = model.predict(sample)[0] print(f"各类别概率: {prob}") print(f"实际类别: {y[0]}")

输出可能是[0.01, 0.02, 0.97],直接看出模型有97%的把握认为是第三类。这种看得见概率的预测,可比硬邦邦的分类结果让人安心多了——就像老中医把完脉告诉你"八成是上火,两成是着凉",总比直接开三斤黄连让人踏实。

说到底,PCA+PNN这个组合就像咖啡配奶泡,一个负责提炼精华,一个负责柔化输出。虽然比不上那些花里胡哨的集成模型,但在需要快速出活儿的场景里,绝对是个能打的组合拳。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 23:30:17

最近在车间调试西门子S7-1200控制四轴伺服的设备,顺手整理了一套实战程序。这套程序里藏着伺服控制的十八般武艺,今天咱们边拆边聊

西门子S7-1200控制四轴伺服程序案例: 1.内容涵盖伺服,步进点动,回原,相对定位,绝对定位,速度模式控制!特别适合学习伺服和步进的朋友们!PTO伺服轴脉冲定位控制速度模式控制扭矩模式&…

作者头像 李华
网站建设 2026/4/19 0:14:24

MDIN380 SDI转VGA 转LVDS VGA转SDI 高清视频处理 MDIN380芯片 ...

MDIN380 SDI转VGA 转LVDS VGA转SDI 高清视频处理 MDIN380芯片 PCB代码方案资料 3G-SDI转VGA ?3G-SDI转LVDS ?高清视频 MDIN380、GV7601 芯片方案(PCB图和源码)。 此方案是韩国视频处理芯片MDIN380的整合应用方案。 3G-SDI转VGA或3G-SDI转LVDS。 方案共有两块电路板(一块底板…

作者头像 李华
网站建设 2026/4/18 8:15:22

三菱PLC步进电机开闭环控制系统源码解析与实现

三菱plc步进电机开闭环控制系统软件工程文件源码工控玩家最爱的干货来了!今天咱们直接拆解三菱FX系列PLC的步进电机控制程序。开环模式用PLSY指令甩脉冲,闭环模式玩高速计数反馈,手把手带你看懂梯形图里的门道。开环控制的核心就藏在下面这段…

作者头像 李华
网站建设 2026/4/17 15:34:54

三轴V90 PN与SMART200玩转指南

西门子smart200和3轴v90 pn网络通讯 西门子smart200和v90 pn通讯控制3轴伺服程序,触摸屏程序,详细注释,控制系统详细说明书,文档详细讲解组态和指令,IO表,电气原理图前两天车间里刚搞完一套三轴伺服控制系…

作者头像 李华