在学习机器学习的时候,接触的第一个算法大都是 KNN。不过在介绍之前,请先允许我讲一下个别名词:
- 交叉验证:将原始数据 随机 分成两组,一组作为训练集,一组作为验证集。训练集训练分类器,验证集验证分类器的效果,并将最后的准确率作为分类器的性能指标。
- 特征缩放:将特征的取值控制在某一范围内,保证每个特征占据的权重一致。常用的是归一化和标准化。
原理介绍
简言之,KNN 算法计算不同特征值之间的距离对样本进行分类。
OK,说完结论,懂的可以直接看代码部分了,如果不能理解的请听我娓娓道来~现在有这么一组数据
原创2022年11月14日...大约 8 分钟