聚类算法四(如 KMeans)本身只会根据特征相似性分组,而不会自动告诉你“这些组代表什么”。因此,需要对聚类Q结果进行解释与命名(簇定义)。
两种确定簇含义的思路:
一、聚类前选定特征(目标导向型)
在开始聚类时就只选取你认为与目标含义相关的特征。例如:要分析“消费者购买习惯”,只使用购买金额、频率、种类等特征,而不使用年龄或行业等无关特征。这样得到的簇,其含义自然与“购买习惯”相关。
二、聚类后再特征选择Q(数据驱动口型)
先用所有特征进行聚类,然后把聚类结果(簇标签)当作“目标变量”,把原始特征作为输入变量。再训练一个监督学习模型(如决策树、随机森林四),通过特征重要性(Feature lmportance)来识别哪些特征最能区分不同簇。注:其核心思想为把聚类结果当标签,再反过来训练监督模型解释它,通过监督学习的可解释性,来反推聚类的结构。总结:聚类的目标不是简单分组,而是要用合适特征构建有意义的簇;通过模型解释或特征重要性识别关键特征;将簇定义为具有业务或科学意义的群体类型。@浙大疏锦行
day22推断聚类后簇的类型
张小明
前端开发工程师
一套系统,如何打通企业“销、研、产、供、服”任督二脉
对于制造业而言,尤其是按单设计(ETO)、按单生产(MTO)型企业,多品种小批量、定制化需求突出的特点,让 “订单及时交付”、“成本精准核算”、“市场快速响应” 成为核心经营目标。 但传统管理模式…
智谱AI推出GLM-Z1-Rumination:反思机制重塑AI长程推理范式
在人工智能领域,模型的推理能力一直是衡量其智能化水平的关键指标。近日,智谱AI在其原有模型GLM-Z1的基础上,通过创新性的扩展强化学习训练方法,成功研发出具备深度反思能力的新一代模型——GLM-Z1-Rumination(以下简称…
SVPWM怎么就比SPWM电压利用率高出了15.5%????
SPWM(正弦脉宽调制)与SVPWM(空间矢量脉宽调制)的核心差异在于直流电压利用率:SPWM最大输出线电压有效值仅为直流母线电压的0.612倍,而SVPWM可达0.707倍,利用率提升约15.5%。其根本原因是SVPWM通…
51、Linux 系统故障排除实用指南
Linux 系统故障排除实用指南 1. 检查 GRUB 配置文件 在 Linux 系统中,若怀疑引导加载程序出现问题,首先要检查系统的 grub.conf 文件。可通过以下步骤操作: - 仔细审查 /etc 目录下的 grub.conf 文件,查看是否存在错误条目。 - 若有必要,可添加被覆盖的操作系统…
Day26:ADC+DAC 综合应用
信号采集与回放系统: ADC 采集外部信号→处理→DAC 输出→d示波器显示 数据记录系统: ADC 采样环境数据→存储到 SD 卡→通过串口上传 PC DAC 高级应用: PWM 低通滤波模拟 DAC 输出 (精度较低但节省资源) 波形发生器 (正弦波、方波、三角波)…
32B参数新标杆:DeepSeek-R1-Distill-Qwen-32B如何应对企业AI落地挑战
导语 【免费下载链接】DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Qwen-32B,基于大规模强化学习,推理能力卓越,性能超越OpenAI-o1-mini,适用于数学、代码与推理任务,为研究社区提供全新小型密集模型。,222 项…