最近邻分类
基本信息
简 介:
关 键 词:
模 型 背 景:一般的分类器,比如决策树和支撑向量机,只要有训练数据可用,它们就开始学习从输入属性到类标号的映射模型,这类学习策略被称为积极学习方法(eager learner)。
模 型 原 理:最近邻分类法是基于类比学习,即通过将给定的检验元组与和它相似的训练元组进行比较来学习。
实施分析步骤:准备数据,对数据进行预处理; 选用合适的数据结构存储训练数据和测试元组; 设定参数,如k;
模 型 应 用:图1 例题图 如上图所示,有两类不同的样本数据,分别用蓝色的小正方形和红色的小三角形表示,而图正中间的那个绿色的圆所标示的数据则是待分类的数据。
运行效果评价:优点 简单,易于理解,易于实现,无需估计参数; 适合对稀有事件进行分类; 特别适合于多分类问题(multi-modal,对象具有多个类别标签), kNN比SVM的表现要好。
输入输出参数
设置: K值 对于k-最近邻分类,未知元组被指派到它的k个最近邻中的多数类。K值的选取非常重要:
方法正文
推荐方法
距离判别分析简介
帕累托图
控制图
支持向量机简介
贝叶斯分类
最近邻分类
决策树
系统聚类
二阶聚类
分类