二阶聚类
基本信息
简 介:
关 键 词:
模 型 背 景:二阶聚类(Two Step Cluster),也常被称为两步聚类,是一种分层群集算法(Hierarchical Algorithms),目前多用于资料采矿与多元统计的交叉领域
模 型 原 理:同其他统计方法一样,二阶聚类也有严苛的适用条件,它要求模型中的变量独立,类别变量是多项式分布,连续变量须是正态分布。
实施分析步骤:二阶聚类的整个聚类过程分为前后两个大的板块来完成: 1)预聚类(pre-clustering)阶段。
模 型 应 用:供给我们研究的数据集是从一家银行提供的公共数据库中的信息,数据真实可靠,在SPSS中,大致有14000条记录。
运行效果评价:二阶聚类的优点在于能够完成海量自动标准化数据处理,且可处理分类变量和连续变量的混合数据,
输入输出参数
设置:二阶聚类分析用来揭示数据集中的自然分组(或聚类),如果不揭示,这些分组是不明显的。
方法正文
推荐方法
距离判别分析简介
帕累托图
控制图
支持向量机简介
贝叶斯分类
最近邻分类
决策树
系统聚类
二阶聚类
分类